⭐ נקודות עיקריות
- גוגל הציגה את דור 8 של שבבי ה-TPU, הכולל דגם לאימון מודלים (8t) ודגם להרצה (8i).
- החומרה החדשה מציעה אימון מהיר עד פי 3 ושיפור של 80% בביצועים ביחס לעלות לעומת הדור הקודם.
- המערכת כוללת שיפור של פי 10 במהירות הגישה לאחסון ופי 3 בנפח זיכרון ה-SRAM על השבב.
- השבבים מציעים שיפור של פי 2 ביעילות האנרגטית (ביצועים לוואט) בהשוואה ל-Ironwood.
גוגל (Google) הכריזה במסגרת ועידת Next 2026 על TPU 8, הדור השמיני של מעבדי ה-TPU (ר”ת Tensor Processing Units) מתוצרתה.
השבבים החדשים פותחו בשיתוף פעולה עם חטיבת הבינה המלאכותית Google DeepMind במטרה לענות על הדרישות הטכניות של עידן “סוכני ה-AI”, הדורשים יכולות הסקה ופעולה רציפות.
שבבי ה-TPU הם מעבדים ייעודיים שתוכננו במיוחד עבור משימות למידת מכונה וצורכים הספק נמוך לעומת מעבדים גרפיים (GPU) רגילים.
ההכרזה הנוכחית מעידה על המאמץ של גוגל ושל חברות נוספות לספק פתרונות חומרה המותאמים בדיוק לארכיטקטורות ה-AI המודרניות.
הכירו את ה-TPU 8
שבבי ה-TPU 8 החדשים נועדו להחליף את ה-TPU 7 המוכר תחת השם Ironwood, כאשר גוגל בחרה לפצל את השבב לשני דגמים המיועדים למשימות שונות:
- ה-TPU 8t נבנה עבור משימות אימון מודלים (Training) תובעניות, במטרה לקצר את מחזורי הפיתוח של מודלי שפה גדולים מחודשים לשבועות.
- ה-TPU 8i מותאם לשלב ההרצה והסקת המסקנות (Inference), שבו המודל נדרש לספק תשובות או לפעול כסוכן אוטונומי בזמן אמת.
לדברי החברה, הפיצול מאפשר אופטימיזציה של רוחב הפס והזיכרון לכל משימה בנפרד. בעוד שה-8t מתמקד ברוחב פס גבוה בין שבבים לצורך אימון מודלים בעלי טריליוני פרמטרים, ה-8i כולל זיכרון מטמון (SRAM) גדול במיוחד על גבי השבב כדי למנוע השהיות בשלב ההרצה והסקת המסקנות.

ביצועים ושיפורים לעומת דור ה-Ironwood
על פי הנתונים הרשמיים שהציגה גוגל, דור השבבים החדש מציג קפיצה משמעותית בכל מדדי הביצועים המרכזיים.
לדברי החברה, ה-TPU 8t מספק מהירות אימון מודלים הגבוהה עד פי 3 לעומת דור ה-Ironwood. בנוסף, המערכת כוללת שיפור של פי 10 במהירות הגישה לאחסון נתונים, מה שמבטיח ניצול מקסימלי של כוח העיבוד ללא עיכובים מיותרים.
בשלב הסקת המסקנות, גוגל מציינת כי ה-TPU 8i מציע שיפור של 80% בביצועים לכל דולר בהשוואה ל-Ironwood.
השבב כולל 384MB של זיכרון SRAM על גבי המעבד, נתון הגבוה פי 3 מהדור הקודם, מה שמאפשר להחזיק את מערך העבודה של המודל קרוב למעבד.
בנוסף, החברה הציגה מנוע האצה ייעודי על השבב (CAE) שמפחית את השהיה הפנימית עד פי 5.
ארכיטקטורה ויעילות אנרגטית
השבבים החדשים משתלבים בתוך מערך ה-AI Hypercomputer, המאפשר חיבור של אלפי יחידות עיבוד למערכת מחשוב-על אחת.
דגם ה-TPU 8t מסוגל להתרחב לעד 9,600 שבבים ב-Superpod (אשכול מחשוב גדול במיוחד של אלפי שבבים הפועלים יחד כמערכת אחת) יחיד עם זיכרון משותף בקיבולת של 2PB (פטה-בייט).
בתחום היעילות , גוגל מדווחת על שיפור של פי 2 בביצועים לכל וואט לעומת דור ה-Ironwood. המערכות עושות שימוש בדור הרביעי של טכנולוגיית הקירור הנוזלי מבית גוגל, המאפשרת להגיע לצפיפות מחשוב גבוהה.
זמינות
שני הדגמים, TPU 8t ו-TPU 8i, יהיו זמינים ללקוחות Google Cloud לקראת סוף השנה הנוכחית.

