⭐ נקודות עיקריות
- הוכרזו מודלי DeepSeek-V4-Pro ו-Flash בקוד פתוח (רישיון MIT).
- המערכת מציעה חלון הקשר של מיליון טוקנים כברירת מחדל.
- לדברי החברה, מתחרים בביצועי מודלים סגורים כמו GPT-5.5, בעלות נמוכה משמעותית.
- זמינים כעת לשימוש דרך פלטפורמות קוד ושירותי API למפתחים.
חברת DeepSeek הכריזה על DeepSeek-V4, דור חדש של מודלי בינה מלאכותית (AI) הכולל את דגמי ה-Pro וה-Flash.
המודלים החדשים מיועדים לספק יכולות מתקדמות עבור מפתחים וארגונים, תוך הצגת עלויות שימוש נמוכות ביחס למתחרים, כאשר במקרה של ה-Claude Opus 4.7 מדובר על שישית מהמחיר.
ההכרזה היא המשך ישיר למודלים הקודמים של החברה, ונועדה להציע אלטרנטיבה למודלים סגורים הנשלטים על ידי חברות טכנולוגיה גדולות.
על פי הודעת החברה, הסדרה החדשה משלבת שינויים ארכיטקטוניים המאפשרים עיבוד מידע רב ויעיל יותר, מה שעשוי לשנות את כדאיות הפיתוח של כלי עזר אוטומטיים עבור משתמשים וארגונים.
הכירו את DeepSeek-V4
סדרת DeepSeek-V4 מבוססת על ארכיטקטורת מומחים מעורבים (Mixture of Experts):
- מודל ה-DeepSeek-V4-Pro כולל 1.6 טריליון פרמטרים בסך הכל, מתוכם 49 מיליארד פרמטרים פעילים בכל בקשה.
- מודל ה-DeepSeek-V4-Flash, המיועד לפעולות מהירות יותר, כולל 284 מיליארד פרמטרים, מתוכם 13 מיליארד פעילים.
שני המודלים תומכים בחלון הקשר של מיליון טוקנים כברירת מחדל. החברה מציינת כי היכולת לעבד כמות נתונים כה גדולה מתאפשרת בזכות שימוש בארכיטקטורת תשומת לב (Attention) היברידית חדשה, לצד שילוב של מנגנונים שנועדו לשמור על יציבות המודל בעומסי מידע (Manifold-Constrained Hyper-Connections).
המודלים עברו אימון מקדים על למעלה מ-32 טריליון טוקנים, לאחר סינון תכנים שנוצרו על ידי מכונה.
???? DeepSeek-V4 Preview is officially live & open-sourced! Welcome to the era of cost-effective 1M context length.
???? DeepSeek-V4-Pro: 1.6T total / 49B active params. Performance rivaling the world's top closed-source models.
???? DeepSeek-V4-Flash: 284B total / 13B active params.… pic.twitter.com/n1AgwMIymu— DeepSeek (@deepseek_ai) April 24, 2026
ביצועים
לדברי DeepSeek, המערכת מציגה יכולות המתקרבות לאלו של המודלים המובילים והסגורים, ולעיתים אף עוקפות מודלים כמו GPT-5.4 ו-Claude Opus 4.6.
עם זאת, בטבלאות השוואה מול המודלים העדכניים ביותר של חברת OpenAI וחברת Anthropic, התמונה מציגה תחרות צמודה.
במבחני ידע והיגיון דוגמת GPQA Diamond, מודל ה-DeepSeek-V4-Pro מציג ציון של 90.1%, מעט אחרי ה-93.6% של GPT-5.5 וה-94.2% של Claude Opus 4.7.
במבחני סוכן דיגיטלי וכתיבת קוד (Agentic Capabilities), המודל מציג נתונים תחרותיים, כאשר במבחן BrowseComp הבוחן יכולות גלישה ברשת באופן עצמאי, הושג ציון של 83.4%, קרוב ל-84.4% של מערכת GPT-5.5 ועוקף את ה-79.3% של Opus 4.7.
לצורך התאמת צריכת המשאבים לדרישת המשתמש, המודל משלב שלוש רמות חשיבה: מצב רגיל (Non-think) לפעולות יומיומיות שוטפות, מצב Think High לניתוח הגיוני, ומצב Think Max המיועד לפתרון בעיות חישוב או קוד מורכבות במיוחד.

זמינות
מודלי ה-DeepSeek-V4 זמינים החל מהיום ללא תשלום תחת רישיון MIT בפלטפורמת Hugging Face, וניתן לגשת אליהם גם באמצעות ממשק ה-API הרשמי של החברה.
הדגש המרכזי של ההכרזה הוא בתמחור הגישה. עלויות ה-API למודל ה-Pro עומדות על 1.74 דולר למיליון טוקני קלט (ו-0.145 דולר כאשר המידע שמור במטמון) ו-3.48 דולר למיליון טוקני פלט.
עלויות אלו נמוכות משמעותית ביחס למודלים סגורים כדוגמת GPT-5.5 או Opus 4.7, שמחיריהם המשותפים לקלט ופלט מגיעים לעשרות דולרים.
גרסת ה-Flash מתומחרת בצורה זולה אף יותר, עם עלות של 0.14 דולר לקלט ו-0.28 דולר לפלט עבור כל מיליון טוקנים.