הוכרז: DeepSeek-V3.1 – דור חדש עם תכונות סוכן מתקדמות

חברת DeepSeek הסינית השיקה את דגם ה-AI החדש שלה, DeepSeek-V3.1, ומציבה רף חדש ליכולות מודלים לשימושים אינטראקטיביים ותפקוד כסוכנים חכמים (Agents).

זהו שדרוג משמעותי לסדרת המודלים של החברה, עם מיקוד בשיפור היעילות, הדיוק והיכולות ההקשריות של המערכת.

מה חדש בדגם DeepSeek-V3.1

DeepSeek-V3.1 מבוסס על ארכיטקטורת היגיון מעורב (Hybrid Reasoning) – שילוב בין מצב “חשיבה” (Think Mode) לבין מצב הפעלה רגיל, עם אפשרות למעבר חלק ביניהם, בדומה למה שהציגה לאחרונה OpenAI עם GPT-5. הארכיטקטורה מאפשרת למשתמשים לבחור בין תגובה מהירה לבין עיבוד מעמיק בהתאם למשימה.

המנוע עבר אופטימיזציה לאחר האימון (Post-Training Optimization), המיועדת לשיפור בשימוש בכלים חיצוניים, קריאות API ויכולות Agent, כולל תמיכה ב-Function Calling מדויק (strict mode).

ביצועים: שיפור דרמטי במבחני קידוד, חיפוש וסוכנים

המודל החדש הציג שיפור ניכר לעומת הגרסאות הקודמות של DeepSeek בסדרה של מבחני ביצועים:

SWE-bench Verified: עלייה ל-66.0 נקודות (לעומת 45.4 בדגם V3-0324)
Terminal-Bench: זינוק ל-31.3 (לעומת 13.3 ו-5.7 בדגמים קודמים)
xbench-DeepSearch: עלייה ל-71.2 לעומת 55.0 בגרסה R1-0528

במבחני סוכנים הכוללים חיפושי רשת ושאלות מורכבות, DeepSeek-V3.1 הדגים ביצועים טובים יותר כמעט בכל מדד, תוך שימוש ב-context window מורחב של עד 128K טוקנים.

השוואת ביצועים DeepSeek V3.1 (תמונה: DeepSeek)

יעילות ביצוע במצב “חשיבה”

מודל DeepSeek-V3.1-Think הציג ביצועים זהים כמעט לחלוטין ל-R1-0528 בשלושה מדדים חשובים (AIME, GPQA, LiveCodeBench) – אך עם חיסכון של 20%-50% במספר הטוקנים:

AIME 2025: ביצועי V3.1-Think עמדו על 88.4%, לעומת 87.5% ב-R1-0528
GPQA Diamond: עם 80.1% מול 81.0%
LiveCodeBench: עם 74.8% מול 73.3%

החיסכון הזה בטוקנים צפוי להשפיע ישירות על עלות וזמן ריצה בשימוש מעשי, במיוחד בהפעלות מרובות.

השוואת ביצועים DeepSeek V3.1 - מצב חשיבה (תמונה: DeepSeek) — השוואת ביצועים DeepSeek V3.1 – חיסכון בטוקנים (תמונה: DeepSeek)

שיפורי API ותמיכה חדשה בפורמט Anthropic

DeepSeek עדכנה את שירות ה-API שלה כך שיתמוך בשני מצבים:

deepseek-chat: מצב רגיל
deepseek-reasoner: מצב חשיבה

ה-API תומך ב-Function Calling מדויק, וכן בפורמט API של Anthropic לטובת התאמה קלה למסגרות פיתוח מבוססות Claude.

מחירים חדשים לשירותי DeepSeek API

החל מה-6 בספטמבר 2025, DeepSeek תעדכן את המחירים הבאים לשימוש ב-API:

קלט מטמון: 0.5 יואן (כ-0.07 דולר) למיליון טוקנים
קלט שאינו במטמון: 4 יואן (כ-0.56 דולר) למיליון טוקנים
פלט: 12 יואן (כ-1.67 דולר) למיליון טוקנים

עד למועד זה, ימשיכו לחול מחירי ההשקה המוזלים.

זמינות: מודל DeepSeek V3.1 פתוח לשימוש

DeepSeek פרסמה את המודל החדש בקוד פתוח, הן כ-Base Model והן כ-Post-trained Model.

המודלים זמינים דרך הפלטפורמות הבאות:

DeepSeek-V3.1-Base ב-Hugging Face
DeepSeek-V3.1 Post-trained ב-Hugging Face
ModelScope – גרסת Base
ModelScope – גרסת Post-trained

ראוי לציין שהגרסה החדשה עושה שימוש בדיוק FP8 עם פרמטרים מסוג UE8M0, ומבצעת התאמות משמעותיות ב-tokenizer וב-chat template – כך שמומלץ למפתחים לקרוא בעיון את תיעוד ההטמעה.

הוכרז: DeepSeek-V3.1 – דור חדש עם תכונות סוכן מתקדמות

מה חדש בדגם DeepSeek-V3.1

ביצועים: שיפור דרמטי במבחני קידוד, חיפוש וסוכנים

יעילות ביצוע במצב “חשיבה”

שיפורי API ותמיכה חדשה בפורמט Anthropic

מחירים חדשים לשירותי DeepSeek API

זמינות: מודל DeepSeek V3.1 פתוח לשימוש

גאדג’טי מסקר: ASUS ROG Zephyrus Duo 2026 - מפלצת עם 2 מסכי OLED

גאדג’טי מסקר: ASUS Zenbook A14 2026 - נייד Snapdragon X2 Elite עם 33 שעות סוללה

Apple iPhone 16 Pro

Apple iPhone 16 Pro Max

Google Pixel 8 Pro

Apple iPhone 15 Pro Max

הוכרז: DeepSeek-V3.1 – דור חדש עם תכונות סוכן מתקדמות

מה חדש בדגם DeepSeek-V3.1

ביצועים: שיפור דרמטי במבחני קידוד, חיפוש וסוכנים

יעילות ביצוע במצב “חשיבה”

שיפורי API ותמיכה חדשה בפורמט Anthropic

מחירים חדשים לשירותי DeepSeek API

זמינות: מודל DeepSeek V3.1 פתוח לשימוש

עוקבים? כל החדשות מגאדג'טי >>

גאדג’טי מסקר: ASUS ROG Zephyrus Duo 2026 - מפלצת עם 2 מסכי OLED

גאדג’טי מסקר: ASUS Zenbook A14 2026 - נייד Snapdragon X2 Elite עם 33 שעות סוללה

Apple iPhone 16 Pro

Apple iPhone 16 Pro Max

Google Pixel 8 Pro

Apple iPhone 15 Pro Max