⭐ נקודות עיקריות
- חברת OpenAI משיקה את GPT-5.3-Codex-Spark, גרסה קלה ומהירה המיועדת לתכנות בזמן אמת.
- המודל פותח בשיתוף חברת השבבים Cerebras ומסוגל לייצר מעל 1,000 טוקנים בשנייה.
- מציג זמני תגובה כמעט מיידיים עם שיפור של 50% בטעינת הטוקן הראשון (Time-to-first-token).
חברת OpenAI הכריזה על השקת גרסת תצוגה מקדימה של ה-GPT-5.3-Codex-Spark, מודל שפה חדש וקטן יותר ממשפחת GPT-5.3, המתוכנן במיוחד עבור משימות תכנות בזמן אמת (Real-time coding). המודל החדש מהווה את אבן הדרך הראשונה בשיתוף הפעולה של החברה עם יצרנית השבבים Cerebras, עליו הוכרז בינואר האחרון.
החברה הציגה את מודל ה-GPT-5.3-Codex-Spark החדש כשבוע בלבד מהצגת מודל ה-GPT-5.3-Codex הרגיל, כאשר גרסת ה-Spark החדשה נועדה לספק מהירות גבוהה יותר בהשוואה אליו עם שימוש בחומרה ייעודית עם זמן שיהוי (Latency) נמוך במיוחד.
לדברי החברה, המודל מסוגל לספק קצב של למעלה מ-1,000 טוקנים בשנייה, תוך שמירה על יכולות גבוהות לביצוע מטלות תכנות יומיומיות. המהלך נועד לאפשר למפתחים להתנסות בעבודה אינטראקטיבית ומהירה.
הכירו את מודל ה-GPT-5.3-Codex-Spark
החידוש המרכזי ב-Codex-Spark הוא האופטימיזציה למהירות ועבודה אינטראקטיבית. בניגוד למודלים הגדולים של החברה, המצטיינים במשימות ארוכות טווח ועבודה אוטונומית, ה-Codex-Spark מיועד לעריכות ממוקדות, שינויי לוגיקה ושיפור ממשקים בזמן אמת.
המודל מופעל על גבי מעבדי ה-Wafer Scale Engine 3 של חברת Cerebras, מאיץ בינה מלאכותית שנבנה במיוחד עבור הסקת מסקנות (Inference) במהירות גבוהה.
שיתוף הפעולה מאפשר ל-OpenAI להוסיף נתיב של השהייה נמוכה (Low-latency path) לארכיטקטורת השרתים הקיימת שלה.
בנוסף לשיפורי החומרה, OpenAI הטמיעה שינויים רוחביים בתשתית התוכנה. החברה הציגה חיבור WebSocket קבוע ואופטימיזציות ב-API, שהובילו להפחתה של 80% בתקורה (Overhead) לכל סבב תקשורת שרת-לקוח, ולהפחתה של 30% בתקורה לכל טוקן.
ביצועים
במבחני הביצועים שהציגה החברה, GPT-5.3-Codex-Spark מדגים יכולות סוכן (Agentic capabilities) חזקות תוך קיצור משמעותי של זמני הביצוע.
במבחן SWE-Bench Pro ובמבחן Terminal-Bench 2.0, המודל השלים משימות בזמן נמוך משמעותית ממודל ה-GPT-5.3-Codex הרגיל.
על פי הנתונים שפורסמו, בעוד שבמבחן ה-Terminal-Bench 2.0 המודל השיג דיוק של 58.4%, לעומת 77.3% של המודל הגדול GPT-5.3-Codex, הוא עקף את גרסת ה-GPT-5.1-Codex-mini שהשיגה 46.1%.
נכון למועד ההשקה, Codex-Spark תומך בקלט ופלט טקסטואלי בלבד ומציע חלון הקשר של 128,000 טוקנים.

זמינות
GPT-5.3-Codex-Spark כבר זמין כגרסת תצוגה מקדימה למחקר עבור משתמשי ChatGPT Pro.