מטא תשיק 4 דורות חדשים של שבבי AI בשנתיים הקרובות

שבבי MITA (מקור מטא) שבבי MITA (מקור מטא)

⭐ נקודות עיקריות

  • מטא מציגה מפת דרכים להשקת ארבעה דורות חדשים של שבבי MTIA בשנתיים הקרובות.
  • האסטרטגיה מתבססת על פיתוח מודולרי מהיר המאפשר שחרור דגמים חדשים כל שישה חודשים.
  • הדורות המתקדמים (450 ו-500) מותאמים במיוחד להסקה (Inference) בבינה מלאכותית יוצרת.
  • השוואת המפרטים מציגה שיפורים דרסטיים ברוחב פס הזיכרון וביצועי החישוב.

מטא (Meta) הכריזה על מפת דרכים חדשה לשבבי הבינה המלאכותית מתוצרתה. במסגרת ההכרזה, החברה ציינה כי תשיק ארבעה דורות חדשים של משפחת שבבי MTIA (ר”ת Meta Training and Inference Accelerator) במהלך השנתיים הקרובות, עם הדגמים MTIA 300, 400, 450 ו-500.

השבבים החדשים נועדו לתמוך בעומסי עבודה של דירוג והמלצות, וכן במשימות של בינה מלאכותית יוצרת (GenAI).

החברה מציינת כי פיתוח השבבים העצמאי יאפשר לה שליטה רבה יותר על תשתיות החומרה שלה, לצד שיפור ביעילות ובעלויות ביחס לשבבים הכלליים הזמינים בשוק.

מפת הדרכים והאסטרטגיה

לדברי החברה, מודל הפיתוח מתבסס על מחזורי שחרור קצרים של כחצי שנה, במטרה להתאים את החומרה במהירות לשינויים המהירים בתחום הבינה המלאכותית ולשלב רכיבים מודולריים (chiplets).

כל דור של MTIA נבנה על בסיס קודמו, תוך שילוב תובנות מעדכנות על עומסי עבודה של AI.

במקום לחכות למחזורי פיתוח ארוכים של שנה או שנתיים, מטא בוחרת בגישה איטרטיבית.

הדורות הבאים תוכננו מתוך גישה ששמה במרכז את שלב ההסקה, אשר נחשב לתובעני וליקר במיוחד בעת הפעלת שירותים בקנה מידה רחב, על מנת לתת מענה לגידול הצפוי בביקוש לבינה מלאכותית יוצרת.

מטא מציינת כי שבבי ה-MTIA נבנים באופן טבעי כדי לעבוד עם אקו-סיסטם התוכנה והחומרה הסטנדרטיים בתעשייה, דוגמת PyTorch ו-vLLM.

גישה זו מאפשרת אימוץ חלק ומהיר של השבבים על ידי צוותי הפיתוח השונים ללא צורך בשכתוב קוד מורכב.

שבב MTIA (מקור מטא)
שבב MTIA (מקור מטא)

ההתפתחות לפי הדורות

השבב הראשון בסדרה, MTIA 300, כבר נמצא כעת בייצור ומשמש לאימון מודלים של דירוג והמלצות. מודל זה הציג יכולות הסקה חזקות והיווה בסיס לפיתוח הדורות הבאים שהותאמו גם לאימון.

הדורות הבאים בסדרה צפויים לספק קפיצת מדרגה משמעותית. דגם MTIA 400 מהווה שיפור עצום מעל קודמו ונועד להציע ביצועים גולמיים תחרותיים למוצרים מסחריים מובילים.

הדגמים MTIA 450 ו-MTIA 500 לוקחים את ההתמקדות בהסקה צעד קדימה, עם שיפורים ייעודיים לבינה מלאכותית יוצרת, כולל הכפלה וחיזוק רוחב הפס של זיכרון ה-HBM.

שרת מבוסס MTIA 400 (מקור מטא)
שרת מבוסס MTIA 400 (מקור מטא)

השוואת מפרטי שבבי MTIA

Metric MTIA 300 MTIA 400 MTIA 450 MTIA 500
מטרת השבב R&R Training General GenAI Inference GenAI Inference
צריכה חשמלית 800W 1200W 1400W 1700W
רוחב פס HBM 6.1TB/s 9.2TB/s 18.4TB/s 27.6TB/s
נפח זיכרון HBM 216GB 288GB 288GB 384-512GB
ביצועי MX4 12PFLOPs 21PFLOPs 30PFLOPs
ביצועי FP8/MX8 1.2PFLOPs 6PFLOPs 7PFLOPs 10PFLOPs
ביצועי BF16 0.6PFLOPs 3PFLOPs 3.5PFLOPs 5PFLOPs
כמות שבבים 16 72 72 72
רוחב פס Scale-up Network 1TB/s 1.2TB/s 1.2TB/s 1.2TB/s
רוחב פס Scale-out Network 200GB/s 100GB/s 100GB/s 100GB/s

זמינות ולוחות זמנים

שבבי ה-MTIA 300 כבר פועלים כעת במערכות של מטא ומשמשים לאימון מודלים.

לדברי החברה, השבבים המתקדמים יותר מסדרות ה-MTIA 400 וה-450 צפויים לפריסה נרחבת במרכזי הנתונים שלה במהלך שנת 2026 ועד תחילת שנת 2027.

פרטים על מחיר או זמינות מסחרית לא נמסרו בשלב זה.

השוואת מפרטים