מודל ה-AI החדש של OpenAI רץ מקומית – גם במחשב וגם בסמארטפון

מודל ה-gpt-oss הפתוח (מקור OpenAI) מודל ה-gpt-oss הפתוח (מקור OpenAI)

OpenAI השיקה את gpt-oss, מודל היגיון (Reasoning) פתוח חדש הזמין להורדה חינמית, שניתן להתאמה אישית ולהרצה באופן מקומי על מחשב נייד רגיל או אפילו מכשיר סלולרי. זוהי הפעם הראשונה מזה למעלה מ-6 שנים שהחברה משחררת מודל פתוח.

בזמן שרבים מחכים להשקה של GPT-5, הדור הבא של מודלי ה-GPT של OpenAI, החברה מציעה היום מגוון רחב של מודלי AI נוספים, בדומה לחברות אחרות כמו מטא עם מודלי ה-LLaMa, גוגל עם Gemini ואנתרופיק עם מודל ה-Claude, כאשר מודל ה-gpt-oss החדש מסמן שינוי עבור OpenAI, שלא הציגה מודל קוד פתוח בניגוד לחלק מהמתחרים שלה.

מודל ה-gpt-oss עבר אימון על מאיצי ה-NVIDIA H100 GPU של אנבידיה עם אופטימיזציה לפלטפורמה של החברה לקבלת ביצועים של 1.5 מיליון טוקנים בשניה על מערכת NVIDIA GB200 NVL72 בודדת, כאשר ניתן להשיג אותו בשתי גרסאות:

  • gpt-oss-120b עם 117 מיליארד פרמטרים המציג ביצועים דומים למודל ה-o4-mini וכולל 128 “מומחים”, כאשר הוא מפעיל 5.1 מיליארד פרמטרים לכל טוקן.
  • gpt-oss-20b עם 21 מיליארד פרמטרים המציג ביצועים דומים למודל ה-o3-mini וכולל 32 “מומחים”, כאשר הוא מפעיל 3.6 מיליארד פרמטרים לכל טוקן.

מה זה אומר למשתמש הרגיל?

בניגוד למודלים הסגורים של OpenAI כמו ChatGPT שדורשים חיבור לאינטרנט ותשלום עבור השימוש, המודל החדש ניתן להורדה והרצה באופן מקומי לחלוטין.

משמעות הדבר היא פרטיות מלאה – המידע שלכם לא נשלח לשרתי החברה, עלויות נמוכות יותר לשימושים נרחבים, ויכולת להתאים את המודל לצרכים מיוחדים.

הגרסה הקטנה של המודל מתאימה במיוחד למפתחים קטנים וחברות בינוניות שרוצות שליטה מלאה על הנתונים שלהן.

היא יכולה לרוץ על חומרה בסיסית יחסית – כל מחשב או אפילו מכשיר סלולרי עם 16GB זיכרון יכול להריץ אותה, מה שהופך אותה לנגישה גם למשתמשים פרטיים.

חברת AMD אף הדגימה את האפשרות להריץ את מודל ה-gpt-oss-120b הגדול יותר על מחשבי +Ryzen AI MAX של החברה.

יכולות מתקדמות בחבילה קטנה

המודל החדש לא רק מתרגם טקסט או עונה על שאלות – הוא מסוגל לבצע משימות חשיבה מורכבות, לגלוש באינטרנט, לכתוב קוד ואפילו לשלוט בסוכנים דיגיטליים באמצעות ממשקי ה-API הקיימים של OpenAI.

המודל גם מציג את “שרשרת המחשבה” שלו – כלומר, אפשר לראות איך הוא מגיע לתשובות, מה שמקל על הבנה ובקרה.

בבדיקות של OpenAI, שני המודלים הציגו תוצאות מרשימות. מודל gpt-oss-120b הגדול השיג 96.6% דיוק במבחן AIME 2024 למתמטיקה תחרותית ואפילו שיפר את התוצאה ל-97.9% ב-AIME 2025.

בתכנות, המודל הגיע ל-2622 נקודות במערכת הדירוג Elo של Codeforces – רמה שמציבה אותו בין המתכנתים הטובים בעולם.

למרות גודלו הקטן, גם מודל ה-gpt-oss-20b שקטן ממנו פי 6 עדיין השיג 96% דיוק במתמטיקה תחרותית ו-2516 נקודות Elo בתכנות – תוצאות שמתחרות עם מודלים גדולים הרבה יותר.

בתחום הבריאות, שני המודלים הציגו ביצועים טובים יותר ממודלים מתקדמים אחרים כמו GPT-4o.

ביצועי Humanity's Last Exam (מקור OpenAI)
ביצועי Humanity’s Last Exam (מקור OpenAI)

זמינות

שני מודלי ה-gpt-oss החדשים זמינים להורדה ושימוש דרך מגוון פלטפורמות ה-AI השונות בהן Hugging Face, Databricks, Azure, GitHub ו-AWS תחת רישיון Apache 2.0 המאפשר שימוש חופשי, שינוי והתאמה למטרות מסחריות ללא מגבלות.

השוואת מפרטים