מודל הקוד הפתוח GLM-5.2 מציג יכולות תחרותיות מול GPT-5.5

Z.ai Z.ai

⭐ נקודות עיקריות

  • חברת Z.ai השיקה את GLM-5.2, מודל דגל המיועד להתמודדות עם משימות פיתוח והנדסה ארוכות טווח.
  • המודל מבוסס על ארכיטקטורה הכוללת 753 מיליארד פרמטרים וחלון הקשר יציב בגודל של מיליון טוקנים.
  • המערכת משלבת את טכנולוגיית IndexShare המפחיתה פי 2.9 את פעולות החישוב הנדרשות לכל טוקן.
  • המודל שוחרר תחת רישיון קוד פתוח מסוג MIT.

חברת Z.ai (לעבר Zhipu AI) הכריזה על השקתו המיידית של GLM-5.2, מודל שפה גדול בקוד פתוח הכולל 753 מיליארד פרמטרים ומיועד עצמאית למשימות פיתוח והנדסת תוכנה.

בחלק ממבחני הקוד וההנדסה מציג המודל ביצועים טובים מ-GPT-5.5, בעוד שבמבחנים אחרים הוא עדיין מפגר אחרי המודלים המובילים של Anthropic ו-OpenAI, תוך שהוא מבוסס על רישיון MIT חופשי.

ההכרזה הנוכחית מציגה ארכיטקטורה שנועדה לאפשר לארגונים להריץ סוכני תוכנה ומערכות פיתוח מקומיות בעלות יכולות מתקדמות, תוך שמירה על עצמאות תשתיתית ומניעת תלות במודלים קוד סגור מסחריים. המודל זמין כעת להורדה ישירה, לשימוש דרך ה-API של החברה ובסביבות פיתוח חיצוניות.

מאפיינים עיקריים

החידוש המרכזי במודל GLM-5.2 הוא שילוב של חלון הקשר (Context Window) יציב בגודל של מיליון טוקנים (1M). פיתוח חלון ההקשר התמקד ביכולת המערכת לשמור על איכות ביצועים עקבית לאורך תהליכי עבודה מתמשכים ומורכבים של סוכני פיתוח (Coding Agents), כגון איתור באגים, אופטימיזציה של ביצועי קוד ומחקר אוטומטי בקנה מידה רחב.

בנוסף, המודל מציג אפשרות לשליטה ידנית ברמת מאמץ החשיבה (Thinking Modes). תכונה זו מאפשרת למשתמשים לבחור בין מצב “Max” המיועד לפתרון בעיות לוגיות מורכבות במיוחד ומנצל כ-85 אלף טוקנים של פלט למשימה, לבין מצב “High” המאזן בין רמת הדיוק למהירות התגובה (Latency) ומפחית את כמות טוקני הפלט בכמחצית.

ביצועים

נתוני הביצועים של GLM-5.2 מציגים שיפור משמעותי לעומת הדור הקודם, GLM-5.1, כאשר המודל מצליח לספק רמת ביצועים גבוהה ותחרותית מאוד ביחס למודלים מתחרים.

במבחני Long-Horizon המיועדים לבדיקת סוכני פיתוח המבצעים משימות הנמשכות שעות ארוכות, GLM-5.2 דורג כמודל הקוד הפתוח המוביל והציג תוצאות הקרובות לאלו של Claude Opus 4.8.

במבחן פתרון בעיות הקוד SWE-bench Pro, המודל רושם ציון של 62.1, לעומת 58.4 בדור הקודם GLM-5.1 ו-58.6 עבור GPT-5.5, בעוד Claude Opus 4.8 מוביל עם ציון של 69.2. גם במבחן Terminal Bench 2.1 רשם המודל שיפור משמעותי עם ציון 81.0 לעומת 63.5 בדור הקודם.

 

מבחני ביצועים GLM-5.2 (מקור Zai)
מבחני ביצועים GLM-5.2 (מקור Zai)

ארכיטקטורה ויעילות תשתיות

כדי לתמוך בחלון הקשר של מיליון טוקנים מבלי לגרום לעלייה חריגה בדרישות העיבוד, החברה הציגה את טכנולוגיית IndexShare.

רכיב זה מאפשר לכל ארבע שכבות של מנגנון הקשב הדליל (Sparse Attention Layers) לחלוק אינדקס קל משקל אחד, ובכך מפחית פי 2.9 את פעולות החישוב (FLOPs) עבור כל טוקן בטווח ההקשר המקסימלי.

השיפורים במנגנון הפענוח הספקולטיבי הגדילו בכ-20% את מספר הטוקנים שהמערכת מסוגלת לאשר בכל מחזור חישוב, מה שמסייע להאיץ את קצב ההפקה.

בתחום הלמידה מחיזוקים (RL), החברה הטמיעה את תשתית slime לניהול תהליכי אימון מקביליים, לצד רכיב ייעודי למניעת מניפולציות על מערכות הציון (Anti-hacking) על ידי סוכני הקוד.

זמינות

מודל ה-GLM 5.2 זמין ב-GitHub ו-HuggingFace.

השוואת מפרטים