אנבידיה (Nvidia) הכריזה במהלך כנס AI Infra Summit 2025 הנערך בארה”ב על Rubin CPX, קטגוריה חדשה של מעבדים גרפיים (GPU) שפותחה במיוחד להאצת ביצועי ההסקה (Inference) עבור יישומים עם הקשר ארוך (Long Context) כמו קידוד ויצירת וידאו.
שבב ה-Rubin CPX מתבסס על פלטפורמת הדור הבא של אנבידיה, Rubin הקרויה על שם ורה רובין (ויקיפדיה), המחליפה את פלטפורמת ה-Blackwell Ultra הנוכחית של החברה.
השבב החדש מתמקד במשימות שמערכות היום לא תוכננו להתמודד איתן, כאשר הוא מאפשר להפוך את עוזרי כתיבת הקוד מבוססי הבינה המלאכותית מכלי פשוט ליצירת קוד למערכות מתוחכמות שיכולות להבין ולייעל פרויקטי תוכנה בקנה מידה גדול.
בתחום עיבוד הוידאו, שיכול לדרוש עד מיליון טוקנים לכל שעת תוכן, המעבד משלב מפענחי ומקודדי וידאו לצד יכולות הסקה בהקשר ארוך בשבב אחד.
ביצועים וארכיטקטורה מתקדמת
ה-Rubin CPX מספק עד 30 פטה-פלופ (petaflops) של ביצועי AI ברמת דיוק של NVFP4, כאשר המעבד כולל 128 גיגה-בייט של זיכרון GDDR7 חסכוני באנרגיה על מנת להאיץ את המשימות התובעניות ביותר הדורשות הקשר ארוך.
הפלטפורמה תשולב במערכת NVIDIA Vera Rubin NVL144 CPX, המבוססת על NVIDIA MGX, הכוללת 8 אקסה-פלופ (exaflops) של ביצועי AI – שיפור של פי 7.5 בביצועים בהשוואה למערכות GB300 NVL72, לצד 100 טרה בייט של זיכרון מהיר ו-1.7 פטה-בייט לשנייה של רוחב פס זיכרון בארון שרתים בודד.
לפי אנבידיה, מערכת Vera Rubin NVL144 CPX תאפשר לחברות לבצע מונטיזציה בהיקף חסר תקדים בזכות יחס הכנסות-לטוקנים (Token Revenue) של 5 מיליארד דולר על כל השקעה של 100 מיליון דולר.

מנכ”ל ג’נסן הואנג, מייסד ומנכ”ל NVIDIA, ציין:
פלטפורמת Vera Rubin – שכוללת את ה-GPU מהדור הבא Rubin לצד קטגוריה חדשה של מעבדים שנקראת CPX – מהווה קפיצת מדרגה נוספת בחזית המחשוב לבינה מלאכותית. בדיוק כפי ש-RTX חולל מהפכה בתחומי הגרפיקה והבינה המלאכותית הפיזית, Rubin CPX הוא ה-GPU הראשון שתומך ב-CUDA ונבנה עבור בינה מלאכותית עם הקשר ארוך, שבה מודלים מסיקים מסקנות ממיליוני טוקנים בו זמנית.
פלטפורמת ה-NVIDIA Rubin CPX החדש צפויה להיות זמינה בסוף 2026.