מיקרוסופט מציגה את Maia 200 – שבב AI חדש להפחתת התלות באנבידיה

שבב Maia 200 (מקור מיקרוסופט) שבב Maia 200 (מקור מיקרוסופט)

⭐ נקודות עיקריות

  • מיקרוסופט הכריזה על ה-Maia 200, מאיץ AI חדש המיועד לתהליכי הסקה (Inference).
  • נתונים רשמיים חושפים יתרון משמעותי בביצועי FP4 ו-FP8 מול שבבי Trainium3 של אמזון ו-TPU v7 של גוגל.
  • השבב מציע את נפח הזיכרון הגבוה בקטגוריה (216GB) ורוחב פס של 7TB/s.
  • ה-Maia 200 כבר בשימוש בשרתים להרצת מודלים מתקדמים כמו GPT-5.2 ו-Copilot.

מיקרוסופט (Microsoft) הכריזה על ה-Maia 200, הדור הבא של מאיצי הבינה המלאכותית של החברה, המיועד לשפר את היעילות הכלכלית והביצועית של תהליכי הסקה (Inference) במודלי שפה גדולים.

השבב החדש מחליף את הדור הקודם שהוצג ב-2023 ומציג קפיצת מדרגה משמעותית בארכיטקטורה ובייצור, כשהוא מציב את מיקרוסופט בתחרות ישירה מול פתרונות החומרה של אמזון וגוגל בתחום הענן.

הכירו את ה-Maia 200

שבב ה-Maia 200 הוא מאיץ AI ייעודי שפותח על ידי מיקרוסופט כדי לתת מענה לדרישות הגוברות של מודלי שפה גנרטיביים (Generative AI).

המהלך נועד לספק לחברה עצמאות משבבי אנבידיה (Nvidia) ולאפשר לה להתחרות כשחקנית עצמאית בתחום מאיצי ה-AI, כאשר הוא מחליף את שבב ה-Maia 100 שהוצג ב-2023.

בניגוד לשבבים המתמקדים באימון מודלים, ה-Maia 200 תוכנן ספציפית עבור שלב ה-Inference – השלב בו המודל מייצר תשובות ותובנות למשתמשי הקצה.

השבב מהווה חלק מתשתית ה-Azure של החברה ומיועד להפחית את העלויות הכרוכות ביצירת “אסימונים” (Tokens) במודלים כבדים.

שבב Maia 200 (מקור מיקרוסופט)
שבב Maia 200 (מקור מיקרוסופט)

ארכיטקטורה וטכנולוגיה

שבב ה-Maia 200 מיוצר בתהליך ה-3nm המתקדם של TSMC. כל שבב מכיל למעלה מ-140 מיליארד טרנזיסטורים, המאורגנים במבנה אריחים (Tiles).

אחד המאפיינים הבולטים בארכיטקטורה הוא מערך הזיכרון המחודש. השבב מצויד ב-216GB של זיכרון HBM3e המספק רוחב פס של 7TB/s, לצד זיכרון SRAM פנימי בנפח 272MB.

שילוב זה נועד למזער את הצורך בתעבורת נתונים חיצונית ולשפר את מהירות הגישה למידע קריטי בזמן אמת.

בנוסף, השבב כולל בקר רשת (NIC) מובנה המספק רוחב פס דו-כיווני של 2.8TB/s לתקשורת מהירה בין שבבים.

אינפוגרפיקה Maia 200
השוואת ביצועים: Maia 200 (מקור: Gemini)

ביצועים והשוואה למתחרים

על פי נתונים טכניים שפרסמה החברה, ה-Maia 200 מציג עליונות ביצועית ברורה בתחום ה-Inference מול המתחרים הישירים: ה-AWS Trainium3 של אמזון וה-TPU v7 של גוגל.

היתרון המשמעותי ביותר נרשם בביצועי FP4, שם ה-Maia 200 מספק 10,145TFLOPS – פי 4 מה-Trainium3 (עם 2,517TFLOPS), וזאת בעוד שלגוגל אין כרגע מענה רשמי בקטגוריה זו.

גם בחישובי FP8, ה-Maia 200 מוביל עם 5,072TFLOPS לעומת 4,614 ב-TPU v7 ו-2,517 ב-Trainium3.

עם זאת, בחישובי BF16, שבב ה-TPU v7 של גוגל שומר על ההובלה עם 2,307TFLOPS לעומת 1,268 ב-Maia 200, נתון המדגיש את המיקוד של מיקרוסופט בדיוקים נמוכים יותר (Quantization) לייעול תהליכי הסקה.

Gadgety.co.il Azure Maia 200 AWS Trainium3 Google TPU v7
תהליך ייצור 3nm 3nm 3nm
ביצועים (FP4 TFLOPS) 10,145 2,517 N/A
ביצועים (FP8 TFLOPS) 5,072 2,517 4,614
ביצועים (BF16 TFLOPS) 1,268 671 2,307
נפח זיכרון (HBM Capacity) 216GB 144GB 192GB
רוחב פס זיכרון (HBM BW) 7TB/s 4.9TB/s 7.4TB/s

צריכת חשמל וקירור

השבב פועל במעטפת תרמית (TDP) של 750 וואט. כדי להתמודד עם פליטת החום וצפיפות השרתים, מיקרוסופט פיתחה מערכת קירור נוזלי במעגל סגור (Sidecar), המותאמת לארונות השרתים הייעודיים של ה-Maia.

הארכיטקטורה כוללת טופולוגיית רשת ייחודית המאפשרת לחבר עד 6,144 מאיצים באשכול (Cluster) אחד, תוך שימוש בפרוטוקול תקשורת מבוסס אתרנט (Ethernet).

נתוני ההשוואה מראים כי רוחב הפס לתקשורת Scale-up ב-Maia 200 עומד על 2.8TB/s, נתון הגבוה משמעותית מ-1.2TB/s שמציע ה-TPU v7, ומתחרה בטווח העליון של ה-Trainium3.

שימושים וזמינות

הייעוד המרכזי של ה-Maia 200 הוא הרצת מודלי שפה מתקדמים, כאשר מיקרוסופט אישרה כי השבב ישמש להרצת מודלי GPT-5.2 של OpenAI, כמו גם עבור שירותי Microsoft 365 Copilot ו-Microsoft Foundry.

השוואת מפרטים