דיפסיק חושפת מודל AI ניסיוני שמפחית את עלויות ההפעלה ב-50%

DeepSeek DeepSeek

חברת דיפסיק (DeepSeek) הסינית הכריזה על DeepSeek-V3.2-Exp, מודל שפה גדול ניסיוני חדש בגודל 685 מיליארד פרמטרים, המציג טכנולוגיית Sparse Attention ייחודית המפחיתה את עלויות ההפעלה בכ-50% בעבודה עם הקשרים ארוכים.

המודל זמין בקוד פתוח תחת רישיון MIT ומציע מחיר API של 0.028 דולר (כ~9.2 אגורות) למיליון טוקני קלט, הפחתה משמעותית לעומת הדור הקודם.

ההכרזה על המודל הניסיוני החדש מגיעה כשבוע בלבד לאחר שחרור ה-V3.1-Terminus, גרסה משודרגת של ה-V3.1.

החברה זכתה לתשומת לב עולמית בתחילת השנה עם מודל ה-R1 שאומן בעלויות נמוכות משמעותית ממודלים מתחרים וגרמה לזעזוע בשוק ה-AI העולמי.

עם המודל החדש, החברה ממשיכה לדחוף את גבולות היעילות בתחום הבינה המלאכותית.

טכנולוגיית DeepSeek Sparse Attention

הלב הטכנולוגי של מודל ה-V3.2-Exp הוא DSA (ר”ת DeepSeek Sparse Attention), מנגנון מתקדם המאפשר למודל לעבד רק את החלקים הרלוונטיים ביותר מהמידע במקום לעבד את כל הטוקנים בהקשר.

המערכת פועלת בשני שלבים מרכזיים: תחילה, מודול בשם “lightning indexer” מזהה את הקטעים החשובים ביותר מחלון הההקשר, ולאחר מכן מערכת “fine-grained token selection” בוחרת טוקנים ספציפיים מתוך אותם קטעים.

בניגוד למנגנוני attention מסורתיים שמחשבים אינטראקציות בין כל טוקן לכל טוקן אחר ברצף, DSA מפחית באופן דרמטי את עומס החישוב על ידי התמקדות רק במידע הרלוונטי.

זה מאפשר למודל לעבוד עם הקשרים ארוכים של עד 128,000 טוקנים (שווה ערך לכ-300-400 עמודים) תוך שמירה על עלויות נמוכות משמעותית.

הפחתת עלויות וביצועים

V3.2-Exp מציע הפחתה דרמטית במחירי ה-API לעומת הדור הקודם. למיליון טוקנים, cache hits עולים כעת 0.028 דולר, cache misses עולים 0.28 דולר, ופלטים עולים 0.42 דולר – לעומת 0.07, 0.56 ו-1.68 דולר בהתאמה תחת תמחור V3.1-Terminus.

בדיקות ראשוניות מצאו שמחיר קריאת API פשוטה יכול לרדת עד למחצית במצבי long-context, מה שהופך את המודל לאטרקטיבי במיוחד עבור משימות כמו סיכום מסמכים ארוכים, שיחות רב-תוריות עם היסטוריה מורחבת, או ניתוח קוד נרחב.

על פי benchmarks שפרסמה DeepSeek, V3.2-Exp מציג ביצועים דומים ל-V3.1-Terminus עם שיפורים קלים בתחומים מסוימים.

בבדיקת MMLU-Pro המודל השיג 85.0, ב-AIME 2025 הוא שיפר ל-89.3, ובדירוג Codeforces עלה מ-2046 ל-2121.

זמינות

מודל ה-DeepSeek-V3.2-Exp זמין החל מהיום דרך ה-API של החברה ובקוד פתוח דרך Hugging Face ו-GitHub.

המודל הקודם V3.1-Terminus יישאר זמין זמנית עד ה-15 באוקטובר.

השוואת מפרטים