חברת Z.ai הסינית (לשעבר Zhipu AI) הכריזה על GLM-4.5, מודל AI “מומחים מעורבים” MoE (ר”ת Mixture of Experts) חדש בגודל של עד 355 מיליארד פרמטרים עם עד 32 מיליארד פרמטרים פעילים, המתמחה במשימות “אג’נטיות” מורכבות, קידוד ויכולות חשיבה מתקדמות.
המודל מציע רמת ביצועים גבוהה לצד תג מחיר נמוך של החל מ-20 סנט (כ~67 אג’) לכל מיליון טוקני קלט.
מודל ה-GLM-4.5 החדש מצטרף לגל ההולך וגדל של מודלי ה-AI הסיניים, ובראשם מודל ה-DeepSeek שהושק בתחילת השנה וזעזע את שוק ה-AI העולמי.
המודלים הסיניים נועדו להתחרות במודלי ה-AI ה”מערביים” כמו Gemini של גוגל ו-GPT של OpenAI.
את מודל ה-GLM-4.5 ניתן למצוא בשתי גרסאות:
- GLM-4.5 הרגיל עם 355 מיליארד פרמטרים, מהם 32 מיליארד פרמטרים פעילים.
- GLM-4.5-Air הקומפקטי עם 106 מיליארד פרמטרים, מהם 12 מיליארד פרמטרים פעילים.

יכולות טכנולוגיות מתקדמות
המאפיין הייחודי של GLM-4.5 הוא התמחותו ב”בינה מלאכותית אג’נטית” – גישה המאפשרת למודל לפרק משימות מורכבות למשימות משנה קטנות יותר כדי להשיג דיוק גבוה יותר.
בדומה למודלי AI אחרים כיום, GLM-4.5 מציע מצב “חשיבה” (thinking mode) למשימות מורכבות ושימוש בכלים, ומצב “רגיל” (non-thinking mode) למשימות פחות מורכבות לקבלת תגובה מהירה יותר.
בהתחשב במחיר הנמוך שלו, מודל ה-GLM-4.5 מציג ביצועים גבוהים במיוחד, עם תוצאה של 63.2 ו-59.8 למודלי ה-GLM-4.5 ו-GLM-4.5-Air בממוצע מבחני AI שונים, כאשר רק מודלי ה-Grok 4 של xAI ו-o3 של OpenAI מציגים תוצאות גבוהות יותר ממודל ה-GLM-4.5 הסטנדרטי.
אחד היתרונות המרכזיים של GLM-4.5 הוא היעילות שלו – המודל דורש רק 8 שבבי NVIDIA H20 לפעולה מלאה.
שבבי ה-H20 הם הגרסה המותאמת לסין של שבבי אנבידיה בעקבות הגבלות הייצוא האמריקניות, מה שמאפשר לחברות סיניות להפעיל מודלי AI מתקדמים בעלויות נמוכות יותר ועם דרישות תשתית מופחתות.

יישומים מעשיים ויכולות פיתוח
GLM-4.5 מתמחה ביצירת יישומים מורכבים, כולל משחקי Flappy Bird אינטראקטיביים, מצגות מתקדמות ואתרים שלמים.
המודל מסוגל לפתח יישומי full-stack עם ממשק משתמש, ניהול בסיסי נתונים ופריסה בצד השרת.
המודל תומך בחלון הקשר של 128,000 טוקנים ומציע יכולות קריאת פונקציות מובנות, המאפשרות לו לעבוד עם מסמכים ארוכים ולבצע משימות מורכבות הדורשות מספר שלבי עיבוד.

זמינות ומחירים
מודל GLM-4.5 החינמי זמין כעת דרך פלטפורמת Z.ai הרשמית של החברה, GitHub ו-Hugging Face.
השימוש ב-API של GLM-4.5 מתומחר כך:
- מודל ה-GLM-4.5 ב-0.6 ו-2.2 דולר לכל מיליון טוקני קלט ופלט (כ~2 ו~7.4 ש”ח).
- מודל ה-GLM-4.5-Air ב-0.2 ו-1.1 דולר לכל מיליון טוקני קלט ופלט (כ~67 אג’ ו-3.7 ש”ח).