הוכרז: DeepSeek-V3.2 – מודל AI עם יכולות חשיבה מתקדמות ברמת GPT-5

DeepSeek DeepSeek

⭐ נקודות עיקריות

  • DeepSeek מציגה את DeepSeek-V3.2 עם ארכיטקטורת MoE ו-671 מיליארד פרמטרים.
  • מנגנון DSA החדש מפחית כ-50% מעלויות הקשר הארוך ותומך בחלון של 128K טוקנים.
  • אימון חיזוק רחב היקף משלב מומחים ייעודיים למתמטיקה, קוד, לוגיקה ומשימות סוכן.
  • גרסת Speciale מציגה עבודת חשיבה מתקדמת וביצועים הגבוהים מגנרטור GPT-5 במבחנים רבים.

חברת DeepSeek הסינית הכריזה על DeepSeek-V3.2, מודל בינה מלאכותית חדש המשלב יעילות חישובית גבוהה עם יכולות חשיבה ועבודה עם כלים מתקדמות.

המודל מבוסס על ארכיטקטורת “מומחים מעורבים” MoE (ר”ת Mixture of Experts) עם 671 מיליארד פרמטרים, כאשר 37 מיליארד פרמטרים פעילים לכל טוקן, ומציג ביצועים המשתווים ל-GPT-5 של OpenAI.

המודל זמין גם בגרסת DeepSeek-V3.2-Speciale עם ביצועים משופרים עבור משימות חשיבה מורכבות.

החידוש המרכזי של V3.2 בהשוואה ל-V3.1 שהוצג לפני מספר חודשים הוא מנגנון DeepSeek Sparse Attention (DSA), שמפחית את מורכבות החישוב ומאפשר הפחתה של כ-50% בעלויות הקשר ארוך (long context) תוך שמירה על דיוק המודל, עם תמיכה מלאה בחלון הקשר של 128K טוקנים.

המנגנון עובד באמצעות שני רכיבים: Lightning Indexer שמחשב ציוני רלוונטיות בין טוקנים, ו-Fine-grained Selector שבוחר רק את הטוקנים החשובים ביותר לעיבוד.

חיזוק למידה בהיקף חסר תקדים

לפי מסמכי המחקר של DeepSeek, החברה השקיעה למעלה מ-10% מהמשאבים של שלב האימון המקדים (pre-training) באימון חיזוק (Reinforcement Learning) באמצעות אלגוריתם GRPO.

האימון התמקד בשישה תחומים מיוחדים: מתמטיקה, תכנות, חשיבה לוגית כללית, משימות סוכן (agent), קידוד וחיפוש, כאשר כל תחום קיבל מודל מומחה ייעודי שמאוחר יותר אוחד למודל הבסיסי.

כדי להבטיח יציבות באימון, החברה פיתחה מספר טכניקות: אומדן KL לא מוטה, מסכות רצפים off-policy, שמירה על נתיבי ניתוב המומחים (Keep Routing) ושמירה על מסכות הדגימה (Keep Sampling Mask).

טכניקות אלו מאפשרות אימון יציב גם בסביבות חישוב מורכבות עם מודלי MoE.

שילוב חשיבה בעבודה עם כלים

אחת החדשנויות המרכזיות ב-V3.2 היא שילוב יכולות החשיבה (thinking mode) בתוך תהליכי עבודה עם כלים.

בניגוד למודלים קודמים שמוחקים את תוכן החשיבה עם הגעת הודעה חדשה, V3.2 שומר את תוכן החשיבה לאורך כל אינטראקציית הכלים ומוחק אותו רק כשמגיעה הודעת משתמש חדשה. זה מפחית באופן משמעותי את צריכת הטוקנים ומשפר את היעילות.

DeepSeek יצרה מערך נתונים סינתטי נרחב למשימות סוכן, הכולל יותר מ-1,800 סביבות שונות ויותר מ-85,000 משימות מורכבות.

המערך כולל סוכני קוד, סוכני חיפוש, כלים כלליים ומתורגמני קוד, כאשר כל המשימות תוכננו להיות קשות לפתרון אך קלות לאימות.

ביצועים ותוצאות

במבחני חשיבה ותכנות, DeepSeek-V3.2 השיג ביצועים דומים ל-GPT-5, עם 93.1% במבחן ה-AIME 2025, ציון של 92.5% ב-HMMT 2025 ודירוג של 2386 ב-Codeforces.

המודל מצטיין במיוחד במשימות סוכן (agent), עם 73.1% במבחן SWE-Verified ו-46.4% ב-Terminal Bench 2.0.

הגרסה המתקדמת DeepSeek-V3.2-Speciale, שפותחה ללא מגבלות אורך מחמירות ועם דגש על חשיבה מורכבת, עולה על GPT-5 ומגיעה לרמת Gemini 3.0 Pro.

גרסה זו משיגה ציונים גבוהים במיוחד במבחנים מתמטיים ותכנותיים, עם 96% ב-AIME 2025, 99.2% ב-HMMT February 2025 ודירוג Codeforces של 2701.

מבחני ביצועים DeepSeek V3.2 (מקור DeepSeek)
מבחני ביצועים DeepSeek V3.2 (מקור DeepSeek)

זמינות המודל DeepSeek-V3.2

שני מודלי DeepSeek-V3.2 זמינים כעת כקוד פתוח דרך GitHub ו-Hugging Face.

מודל V3.2 הסטנדרטי מתמקד באיזון בין ביצועים ליעילות טוקנים, בעוד ש-V3.2-Speciale מציע ביצועים מקסימליים לחוקרים ומשתמשים מתקדמים.

השוואת מפרטים