⭐ נקודות עיקריות
- חברת Cursor השיקה את מודל ה-AI לכתיבת קוד Composer 2.5 המבוסס על נקודת הביקורת הפתוחה Kimi K2.5.
- המודל מציג ביצועים המשתווים ל-Opus 4.7 ו-GPT-5.5 במבחני ביצועים, אך בעלות נמוכה משמעותית למשימה.
- תהליך האימון שודרג באמצעות שיטת למידת חיזוק חדשה המבוססת על משוב טקסטואלי ממוקד לשגיאות מקומיות.
- המודל זמין כעת בסביבת הפיתוח.
חברת Cursor הכריזה על השקת Composer 2.5, עדכון נרחב למודל הבינה מלאכותית (AI) הפנימי שלה המיועד לכתיבת קוד.
המודל החדש משתלב ישירות בסביבת הפיתוח ומציג שיפור ביכולת ההתמדה במשימות ארוכות טווח ובמעקב אחר הנחיות מורכבות.
זהו אחד העדכונים המשמעותיים של השנה בתחום כלי הפיתוח מבוססי הבינה המלאכותית, שכן המודל מצליח להשתוות למודלי קצה מובילים בשוק בעלות הפעלה נמוכה בהרבה.
Composer 2.5 מוגדר ככלי פיתוח מתקדם הבנוי על נקודת הביקורת (Checkpoint) הפתוחה Kimi K2.5 של חברת Moonshot.
עבור מפתחים, השינוי המרכזי נוגע ליכולת ההתמודדות של המודל עם שגיאות והנחיות מורכבות, מה שמאפשר עבודה רציפה ומדויקת יותר לאורך זמן מבלי לייקר את עלויות התפעול השוטפות של הפרויקט.
מה חדש ב-Composer 2.5
החברה שינתה את תשתית האימון של המודל באמצעות הרחבת היקף הנתונים, יצירת סביבות למידת חיזוק (Reinforcement Learning) מורכבות והטמעת שיטות למידה חדשות.
המודל אומן על כמות הגדולה פי 25 של משימות סינתטיות בהשוואה לגרסת Composer 2, כאשר כ-85% מתקציב המחשוב הכולל של הפרויקט הוקצה לתהליכי אימון משלימים ולמידת חיזוק.
כדי לפתור את אתגר הקצאת הקרדיטים (Credit assignment) בתהליכי למידת חיזוק שבהם פלטי המודל מגיעים למאות אלפי טוקנים, החברה הטמיעה שיטת אימון המבוססת על משוב טקסטואלי ממוקד (Targeted RL with textual feedback).
המערכת מספקת רמזים ומשוב מדויק ישירות בנקודה הספציפית ברצף שבה המודל ביצע שגיאה, כגון ניסיון לקרוא לכלי שאינו זמין או יצירת הסבר לא ברור.
באמצעות שימוש במודל מורה שמקבל את הרמז המקומי בתוך ההקשר, המערכת מפעילה הפסד זיקוק (Distillation KL loss) המקרב את הסתברויות הטוקנים של המודל הלומד אל אלו של המורה לאותו צעד בלבד.
פתרון זה מאפשר לשנות התנהגות מקומית שגויה בריצות ארוכות מבלי לפגוע ביעד הכולל של הריצה או להסתמך על אותות רקע רועשים.

ביצועים
במבחני ביצועים רשמיים, המודל מציג תוצאות המציבות אותו בקו אחד עם פתרונות הקצה המסחריים הגדולים ביותר.
במבחן SWE-Bench Multilingual מציג המודל נתון של 79.8%, ובמבחן CursorBench v3.1 הוא מגיע לציון של 63.2%.
נתונים אלו מאפשרים ל-Composer 2.5 להשתוות בביצועיו למודלים ממתחרים כגון Opus 4.7 של חברת Anthropic ו-GPT-5.5 של חברת OpenAI, אך הוא עושה זאת בעלות הפעלה נמוכה בהרבה עבור כל משימה.

זמינות ומחיר
מודל Composer 2.5 זמין כעת לשימוש בתוך סביבת הפיתוח של Cursor.
מחיר השימוש בגרסה הרגילה נקבע על 0.5 ו-2.5 דולר למיליון טוקנים של קלט ופלט בהתאמה.
בנוסף, החברה מציעה גרסה מהירה יותר השומרת על אותה רמת ביצועים, במחיר של 3 ו-15 דולר למיליון טוקנים של קלט ופלט.