חברת DeepSeek הסינית השיקה את דגם ה-AI החדש שלה, DeepSeek-V3.1, ומציבה רף חדש ליכולות מודלים לשימושים אינטראקטיביים ותפקוד כסוכנים חכמים (Agents).
זהו שדרוג משמעותי לסדרת המודלים של החברה, עם מיקוד בשיפור היעילות, הדיוק והיכולות ההקשריות של המערכת.
מה חדש בדגם DeepSeek-V3.1
DeepSeek-V3.1 מבוסס על ארכיטקטורת היגיון מעורב (Hybrid Reasoning) – שילוב בין מצב “חשיבה” (Think Mode) לבין מצב הפעלה רגיל, עם אפשרות למעבר חלק ביניהם, בדומה למה שהציגה לאחרונה OpenAI עם GPT-5. הארכיטקטורה מאפשרת למשתמשים לבחור בין תגובה מהירה לבין עיבוד מעמיק בהתאם למשימה.
המנוע עבר אופטימיזציה לאחר האימון (Post-Training Optimization), המיועדת לשיפור בשימוש בכלים חיצוניים, קריאות API ויכולות Agent, כולל תמיכה ב-Function Calling מדויק (strict mode).
ביצועים: שיפור דרמטי במבחני קידוד, חיפוש וסוכנים
המודל החדש הציג שיפור ניכר לעומת הגרסאות הקודמות של DeepSeek בסדרה של מבחני ביצועים:
- SWE-bench Verified: עלייה ל-66.0 נקודות (לעומת 45.4 בדגם V3-0324)
- Terminal-Bench: זינוק ל-31.3 (לעומת 13.3 ו-5.7 בדגמים קודמים)
- xbench-DeepSearch: עלייה ל-71.2 לעומת 55.0 בגרסה R1-0528
במבחני סוכנים הכוללים חיפושי רשת ושאלות מורכבות, DeepSeek-V3.1 הדגים ביצועים טובים יותר כמעט בכל מדד, תוך שימוש ב-context window מורחב של עד 128K טוקנים.

יעילות ביצוע במצב “חשיבה”
מודל DeepSeek-V3.1-Think הציג ביצועים זהים כמעט לחלוטין ל-R1-0528 בשלושה מדדים חשובים (AIME, GPQA, LiveCodeBench) – אך עם חיסכון של 20%-50% במספר הטוקנים:
- AIME 2025: ביצועי V3.1-Think עמדו על 88.4%, לעומת 87.5% ב-R1-0528
- GPQA Diamond: עם 80.1% מול 81.0%
- LiveCodeBench: עם 74.8% מול 73.3%
החיסכון הזה בטוקנים צפוי להשפיע ישירות על עלות וזמן ריצה בשימוש מעשי, במיוחד בהפעלות מרובות.

שיפורי API ותמיכה חדשה בפורמט Anthropic
DeepSeek עדכנה את שירות ה-API שלה כך שיתמוך בשני מצבים:
- deepseek-chat: מצב רגיל
- deepseek-reasoner: מצב חשיבה
ה-API תומך ב-Function Calling מדויק, וכן בפורמט API של Anthropic לטובת התאמה קלה למסגרות פיתוח מבוססות Claude.
מחירים חדשים לשירותי DeepSeek API
החל מה-6 בספטמבר 2025, DeepSeek תעדכן את המחירים הבאים לשימוש ב-API:
- קלט מטמון: 0.5 יואן (כ-0.07 דולר) למיליון טוקנים
- קלט שאינו במטמון: 4 יואן (כ-0.56 דולר) למיליון טוקנים
- פלט: 12 יואן (כ-1.67 דולר) למיליון טוקנים
עד למועד זה, ימשיכו לחול מחירי ההשקה המוזלים.
זמינות: מודל DeepSeek V3.1 פתוח לשימוש
DeepSeek פרסמה את המודל החדש בקוד פתוח, הן כ-Base Model והן כ-Post-trained Model.
המודלים זמינים דרך הפלטפורמות הבאות:
- DeepSeek-V3.1-Base ב-Hugging Face
- DeepSeek-V3.1 Post-trained ב-Hugging Face
- ModelScope – גרסת Base
- ModelScope – גרסת Post-trained
ראוי לציין שהגרסה החדשה עושה שימוש בדיוק FP8 עם פרמטרים מסוג UE8M0, ומבצעת התאמות משמעותיות ב-tokenizer וב-chat template – כך שמומלץ למפתחים לקרוא בעיון את תיעוד ההטמעה.