הוכרז: GPT-5.2-Codex – כלי AI חדש למפתחים ולסייבר הגנתי

GPT-5.2-CODEX באדיבות OpenAI

⭐ נקודות עיקריות

  • OpenAI הכריזה על GPT-5.2-Codex – מודל קוד אגנטי (agentic) שמכוון למשימות הנדסת תוכנה בעולם האמיתי וסייבר הגנתי.
  • שיפורים בולטים: עבודה ארוכת טווח בעזרת דחיסת הקשר (context compaction), שינויי קוד גדולים כמו רפקטור ומיגרציה, ותמיכה טובה יותר בסביבות Windows.
  • המודל מציג תוצאות מובילות ב-SWE-Bench Pro וב-Terminal-Bench 2.0, לצד קפיצה ביכולות סייבר והדגשת סיכוני dual-use.
  • זמין כבר היום למשתמשי ChatGPT בתשלום בכל משטחי Codex, עם תכנון לפתוח גישה דרך ה-API בשבועות הקרובים וגישת trusted access למאמצי סייבר הגנתיים.

OpenAI הכריזה על GPT-5.2-Codex, מודל הקידוד האגנטי (agentic) המתקדם ביותר שלה עד כה, שמיועד למשימות הנדסת תוכנה מקצועיות ולתחום הסייבר ההגנתי.

לפי החברה, מדובר בגרסה של GPT-5.2 שעברה אופטימיזציה לעבודה בתוך Codex, עם דגש על משימות ארוכות טווח, שינויי קוד רחבי היקף והקשחה משמעותית ביכולות אבטחת מידע.

ההכרזה מגיעה זמן קצר אחרי השקת GPT-5.2, וב-OpenAI מציינים כי ככל שהמודלים מתקדמים, קפיצות היכולת אינן נשארות רק בתחום הכתיבה והקוד, אלא מתבטאות גם ביכולות בתחומי משנה כמו סייבר – מה שמחייב גישה מדורגת וזהירה יותר בהפצה.

מה זה Codex?

Codex הוא סט כלים וסביבת עבודה של OpenAI לפיתוח תוכנה בעזרת בינה מלאכותית, ולא רק מודל שכותב קוד לפי בקשה.

מדובר במעטפת אגנטית (מבוססת סוכנים) שמאפשרת למודל לעבוד כמו שותף פיתוח בתוך תהליך הנדסי אמיתי – עם גישה למאגרי קוד, הרצת פקודות טרמינל, בנייה, בדיקות ותיקונים איטרטיביים לאורך זמן. בה

מאפיינים עיקריים

GPT-5.2-Codex נועד להתמודד עם משימות מורכבות שמאפיינות פיתוח תוכנה מודרני, במיוחד כשהעבודה נעשית לאורך זמן, בתוך מאגרי קוד גדולים, ותוך צורך לחזור שוב ושוב על החלטות שכבר התקבלו.

בין השיפורים ש-OpenAI מדגישה:

  • עבודה לטווח ארוך בעזרת דחיסת הקשר (context compaction) – יכולת לשמור על רצף משימה לאורך סשנים ארוכים, תוך שמירה על ההקשר הרלוונטי באופן יעיל יותר.
  • שינויי קוד רחבי היקף – שיפור בביצוע משימות כמו שינויי קוד גדולים (רפקטורים), מיגרציות בין גרסאות או מסגרות, ובנייה של פיצ’רים שמחייבים נגיעה בהרבה קבצים ויחידות קוד.
  • אמינות גבוהה יותר בהפעלת כלים – דגש על קריאות כלי פיתוח בצורה עקבית, כחלק מעבודה אגנטית שמתקדמת לפי תוכנית ומשפרת את התוצאה איטרטיבית.
  • ביצועים טובים יותר ב-Windows – התאמה טובה יותר לסביבות פיתוח מקומיות ב-Windows, על בסיס יכולות שהחברה מייחסת גם לדור GPT-5.1-Codex-Max.
  • שיפור ביכולת ראייה (vision) – פרשנות מדויקת יותר של צילומי מסך, תרשימים טכניים, גרפים וממשקים, לטובת עבודה שמערבת UI, תיעוד ותקלות שמגיעות מהשטח.

המסר המרכזי של OpenAI כאן הוא ש-Codex אמור להפוך לשותף עבודה שמחזיק הקשר, מבצע צעדים מעשיים וממשיך להתקדם גם כשהמשימה משתנה, כשנדרש לתקן ניסיונות כושלים, או כשהיעד משתנה באמצע.

ביצועי GPT-5.2 Codex (קרדיט: OpenAI)
ביצועי GPT-5.2 Codex (קרדיט: OpenAI)

ביצועים

OpenAI מפרסמת נתוני ביצועים בשני מבחנים שמכוונים לא רק ליכולת “לכתוב קוד”, אלא ליכולת לבצע משימות הנדסיות באופן אגנטי בסביבה מציאותית:

  • SWE-Bench Pro – המודל מקבל מאגר קוד וצריך להפיק תיקון (patch) שמפתר משימה הנדסית ריאליסטית. GPT-5.2-Codex מדווח על 56.4% דיוק, לעומת 55.6% ל-GPT-5.2 ו-50.8% ל-GPT-5.1.
  • Terminal-Bench 2.0 – מבחן לסוכנים (agents) בסביבות טרמינל אמיתיות, עם משימות כמו קומפילציה, אימון מודלים והקמת שרתים. GPT-5.2-Codex מדווח על 64.0% דיוק, לעומת 62.2% ל-GPT-5.2 ו-58.1% ל-GPT-5.1-Codex-Max.

ההקשר שמסביב למספרים חשוב לא פחות: החברה מציגה את GPT-5.2-Codex כמודל שמסוגל לשמור “תמונה מלאה” לאורך זמן בתוך ריפוזיטורי גדול, לבצע שינויים שמערבים הרבה רכיבים, ולהמשיך לתפקד גם כשהמשימה דורשת כמה סבבים של בדיקה, תיקון וחזרה לאחור.

קפיצה ביכולות הסייבר

OpenAI טוענת כי GPT-5.2-Codex מציג יכולות סייבר חזקות יותר מכל מודל שהשיקה עד כה, וממקמת את השיפור הזה כחלק ממגמה: כל דור של Codex מביא איתו קפיצה נוספת ביכולת לבצע משימות שמזכירות עבודה של חוקר אבטחה מקצועי.

לצד זאת, החברה מדגישה את סיכוני ה-dual-use: אותם כלים שעוזרים למגנים (defenders) למצוא חולשות, לבצע בדיקות ולתקן מהר יותר, יכולים גם לשמש תוקפים להאצת ניצול חולשות.

לפי OpenAI, מודל ה-GPT-5.2-Codex עדיין לא מגיע לרמת “High” במסגרת ההיערכות שלה (Preparedness Framework), אך אופן ההפצה וההגנות מתוכננים מתוך הנחה שמודלים עתידיים עלולים להתקרב לרף הזה.

דוגמה מרכזית שהחברה מציגה מהשבוע הקודם מתארת תהליך שבו חוקר אבטחה השתמש ב-Codex CLI ובסוכני קוד כדי לנתח חולשות ב-React, לבנות סביבת בדיקה, לבצע תהליך איטרטיבי הכולל גם fuzzing (בדיקות עם קלטים אקראיים וחריגים לזיהוי חולשות), ולבסוף להגיע לגילוי חולשות שלא היו ידועות קודם – ולדיווח האחראי בצוות הפיתוח.

יכולות נוספות ושימושים בפועל

מעבר למספרי בנצ’מרק, OpenAI מציגה את GPT-5.2-Codex כמנוע שמכוון לעבודה פרקטית:

  • עבודה ממושכת במאגרים גדולים – שימור הקשר לאורך זמן, גם כשעוברים בין קבצים רבים ומשימות משנה.
  • רפקטור ומיגרציה – התמודדות עם שינויים רוחביים שבהם צריך להתאים APIs, להחליף תלויות או לשנות ארכיטקטורה.
  • תרגום עיצוב לקוד – שימוש במוקים (design mocks) ותוצרים חזותיים כדי להרים אבטיפוס פונקציונלי, ואז להתקדם איתו לכיוון מוצר.
  • ניתוח ויזואלי לפיתוח – הבנה טובה יותר של תקלות שמגיעות כצילומי מסך, תרשימים או UI, והפיכת המידע הזה לצעדי תיקון.

זמינות

GPT-5.2-Codex זמין כבר היום לכל המשתמשים המשלמים של ChatGPT בכל משטחי Codex.

במקביל, OpenAI מציינת שהיא פועלת לאפשר גישה בטוחה ל-GPT-5.2-Codex גם למשתמשי ה-API בשבועות הקרובים.

בציר נפרד, החברה מקדמת פיילוט של trusted access – תוכנית גישה “בהזמנה בלבד” למקצוענים וארגונים שעוסקים בסייבר הגנתי, עם בדיקות התאמה שמכוונות לרקע מקצועי ולשימוש אחראי.

לפי OpenAI, המטרה היא לאפשר עבודות לגיטימיות שיכולות להיתקל במגבלות מוצר סטנדרטיות – למשל סימולציות שמדמות תוקפים לצורך תיקון, ניתוח נוזקות לצורכי התמודדות, או בדיקות עומס ותשתיות.

למי שרוצה להתחיל לעבוד עם הכלים מקומית, OpenAI מציגה גם את ההתקנה של Codex CLI דרך npm:

  • $ npm i -g @openai/codex

מה המשמעות למפתחים ולצוותי אבטחה

המסר של OpenAI מהשקת GPT-5.2-Codex הוא כפול:

  • מצד אחד, כלי אגנטי שמבין הקשר, שומר רצף, עובד טוב יותר עם כלים וסביבות אמיתיות, ומתאים לעבודה הנדסית מתמשכת;
  • מצד שני, שדרוג כזה ביכולת, במיוחד סביב סייבר, מחייב פריסה מדורגת, הגנות ונהלי גישה זהירים יותר.

אם השיפור ביכולת “לטפל במשימה” חשוב לפיתוח תוכנה, הרי שבסייבר המשמעות יכולה להיות דרמטית עוד יותר: האצה של איתור, אימות ותיקון חולשות בפרויקטים נפוצים, יחד עם הצורך להקפיד שהיכולת הזו לא הופכת למכפיל כוח לצד של התוקף.

השוואת מפרטים