הוכרז: GPT-5.3-Codex-Spark – מודל תכנות מהיר מבית OpenAI

GPT-5.3-Codex-Spark (מקור OpenAI) GPT-5.3-Codex-Spark (מקור OpenAI)

⭐ נקודות עיקריות

  • חברת OpenAI משיקה את GPT-5.3-Codex-Spark, גרסה קלה ומהירה המיועדת לתכנות בזמן אמת.
  • המודל פותח בשיתוף חברת השבבים Cerebras ומסוגל לייצר מעל 1,000 טוקנים בשנייה.
  • מציג זמני תגובה כמעט מיידיים עם שיפור של 50% בטעינת הטוקן הראשון (Time-to-first-token).

חברת OpenAI הכריזה על השקת גרסת תצוגה מקדימה של ה-GPT-5.3-Codex-Spark, מודל שפה חדש וקטן יותר ממשפחת GPT-5.3, המתוכנן במיוחד עבור משימות תכנות בזמן אמת (Real-time coding). המודל החדש מהווה את אבן הדרך הראשונה בשיתוף הפעולה של החברה עם יצרנית השבבים Cerebras, עליו הוכרז בינואר האחרון.

החברה הציגה את מודל ה-GPT-5.3-Codex-Spark החדש כשבוע בלבד מהצגת מודל ה-GPT-5.3-Codex הרגיל, כאשר גרסת ה-Spark החדשה נועדה לספק מהירות גבוהה יותר בהשוואה אליו עם שימוש בחומרה ייעודית עם זמן שיהוי (Latency) נמוך במיוחד.

לדברי החברה, המודל מסוגל לספק קצב של למעלה מ-1,000 טוקנים בשנייה, תוך שמירה על יכולות גבוהות לביצוע מטלות תכנות יומיומיות. המהלך נועד לאפשר למפתחים להתנסות בעבודה אינטראקטיבית ומהירה.

הכירו את מודל ה-GPT-5.3-Codex-Spark

החידוש המרכזי ב-Codex-Spark הוא האופטימיזציה למהירות ועבודה אינטראקטיבית. בניגוד למודלים הגדולים של החברה, המצטיינים במשימות ארוכות טווח ועבודה אוטונומית, ה-Codex-Spark מיועד לעריכות ממוקדות, שינויי לוגיקה ושיפור ממשקים בזמן אמת.

המודל מופעל על גבי מעבדי ה-Wafer Scale Engine 3 של חברת Cerebras, מאיץ בינה מלאכותית שנבנה במיוחד עבור הסקת מסקנות (Inference) במהירות גבוהה.

שיתוף הפעולה מאפשר ל-OpenAI להוסיף נתיב של השהייה נמוכה (Low-latency path) לארכיטקטורת השרתים הקיימת שלה.

בנוסף לשיפורי החומרה, OpenAI הטמיעה שינויים רוחביים בתשתית התוכנה. החברה הציגה חיבור WebSocket קבוע ואופטימיזציות ב-API, שהובילו להפחתה של 80% בתקורה (Overhead) לכל סבב תקשורת שרת-לקוח, ולהפחתה של 30% בתקורה לכל טוקן.

ביצועים

במבחני הביצועים שהציגה החברה, GPT-5.3-Codex-Spark מדגים יכולות סוכן (Agentic capabilities) חזקות תוך קיצור משמעותי של זמני הביצוע.

במבחן SWE-Bench Pro ובמבחן Terminal-Bench 2.0, המודל השלים משימות בזמן נמוך משמעותית ממודל ה-GPT-5.3-Codex הרגיל.

על פי הנתונים שפורסמו, בעוד שבמבחן ה-Terminal-Bench 2.0 המודל השיג דיוק של 58.4%, לעומת 77.3% של המודל הגדול GPT-5.3-Codex, הוא עקף את גרסת ה-GPT-5.1-Codex-mini שהשיגה 46.1%.

נכון למועד ההשקה, Codex-Spark תומך בקלט ופלט טקסטואלי בלבד ומציע חלון הקשר של 128,000 טוקנים.

ביצועי GPT-5.3-Codex-Spark (מקור OpenAI)
ביצועי GPT-5.3-Codex-Spark (מקור OpenAI)

זמינות

GPT-5.3-Codex-Spark כבר זמין כגרסת תצוגה מקדימה למחקר עבור משתמשי ChatGPT Pro.

השוואת מפרטים