יכולות קידוד וחשיבה מתקדמות: OpenAI מכריזה על GPT-5-Codex

GPT-5-Codex (מקור OpenAI) GPT-5-Codex (מקור OpenAI)

OpenAI הכריזה על GPT-5-Codex, גרסה מותאמת של מודל GPT-5 למשימות קידוד אוטונומיות בסוכן ה-AI Codex.

המודל החדש מתאפיין ביכולות “חשיבה” דינמיות המאפשרות לו להקדיש למשימות קידוד בין מספר שניות לעד שבע שעות רצופות, בהתאם למורכבות המשימה.

לאחר שהכריזה בחודש הקודם על מודל ה-GPT-5 העדכני שהגיע בחמש גרסאות שונות, OpenAI מעדכנת גם את מודל התכנות שלה, ה-Codex, עם גרסה חדשה המציגה ביצועי תכנות משופרים בהשוואה למודל ה-GPT-5 הסטנדרטי.

יכולות חשיבה מתקדמות

בניגוד למודלי השפה הרגילים שמקדישים זמן קבוע לכל משימה, GPT-5-Codex מסוגל להתאים את זמן החשיבה שלו דינמית.

אלכסנדר אמביריקוס, מוביל המוצר Codex בחברה, הסביר שהמודל יכול להחליט באמצע פתרון בעיה שהוא זקוק לשעה נוספת של עבודה, במקום לקבוע מראש את הזמן הנדרש.

המודל אומן על משימות הנדסת תוכנה מורכבות מהעולם האמיתי, כולל בניית פרויקטים שלמים מההתחלה, הוספת תכונות ובדיקות וביצוע ריפקטורינג רחב היקף.

על פי החברה, במהלך המבחנים נצפה המודל עובד באופן עצמאי למשך יותר מ-7 שעות על משימות מורכבות.

ביצועים משופרים

מודל ה-GPT-5-Codex מציג שיפורים במגוון תחומי התכנות. בסקירות קוד, המודל הפחית את כמות ההערות השגויות מ-13.7% ל-4.4% והגדיל את ההערות בעלות ההשפעה הגבוהה מ-39.4% ל-52.4%.

במבחני ביצועים נוספים, המודל השיג תוצאות משופרות:

  • SWE-bench Verified – השיג ציון של 74.5% לעומת 72.8% ב-GPT-5.
  • משימות ריפקטורינג קוד – השיג ציון של 51.3% לעומת 33.9% ב-GPT-5.

במבחנים פנימיים של OpenAI נמצא כי עבור 10% מהפניות הפשוטות יותר (העשירון התחתון), GPT-5-Codex משתמש ב-93.7% פחות טוקנים (יחידות עיבוד טקסט) לעומת GPT-5.

בעבור 10% מהפניות המורכבות יותר (העשירון העליון), המודל מקדיש פי שניים יותר זמן לחשיבה ועריכה.

מבחני ביצועים GPT-5-Codex (מקור OpenAI)
מבחני ביצועים GPT-5-Codex (מקור OpenAI)

שיפורים נוספים ב-Codex

לצד המודל החדש, OpenAI הציגה שדרוגים משמעותיים למוצר Codex עצמו. השיפורים כוללים ממשק מחודש ל-CLI, הרחבת IDE חדשה ל-VS Code ו-Cursor, ויכולות סקירת קוד אוטומטיות.

במחקרי החברה, Codex כבר בוחן את רוב ה-Pull Requests של החברה ומוצא מאות בעיות מדי יום.

GPT-5-Codex זמין עכשיו לכל מנויי ChatGPT Plus, Pro, Business, Edu ו-Enterprise כחלק מהשירות הקיים שלהם.

השוואת מפרטים