קוואלקום (Qualcomm) הכריזה על דור חדש של פתרונות AI למרכזי נתונים: Qualcomm AI200 ו-Qualcomm AI250.
המערכות החדשות מיועדות לביצוע “היסק” (Inference) של מודלי בינה מלאכותית גנרטיבית ומבטיחות ביצועים גבוהים ביחס לצריכת החשמל והעלות הכוללת (TCO).
ההכרזה מסמנת את כניסת קוואלקום לתחרות ישירה עם אנבידיה בשוק פתרונות ה-AI היעודיים, שוק בו אנבידיה שולטת כיום, לצד AMD המחזיקה בנתח שוק קטן יותר.
בעקבות ההכרזה על השבבים והכניסה לתחרות בחברות כמו AMD ואנבידיה, זינקה מניית קוואלקום בכ-11% במהלך המסחר בנאסד”ק אתמול.
AI200 – פתרון מאוזן לעלות נמוכה
ה-Qualcomm AI200 הוא פתרון שתוכנן במיוחד לביצוע Inference עם דגש על עלות תפעול נמוכה וביצועים אופטימליים.
המערכת תומכת ב-768GB של זיכרון LPDDR (לא ידוע באיזו גרסה) לכל כרטיס, מה שמספק קיבולת זיכרון גבוהה במיוחד ועלות נמוכה יותר לעומת טכנולוגיות זיכרון אחרות.
המערכת כוללת קירור נוזלי ישיר ליעילות תרמית מקסימלית, ממשקי PCIe להרחבת המערכת וקישורית אתרנט (Ethernet) לחיבור בין ארונות תקשורת (Racks).
בנוסף, המערכת תומכת ב-Confidential Computing להרצת עומסי עבודה מאובטחים, כאשר צריכת החשמל ברמת ארון התקשורת עומדת על 160 קילוואט.

AI250 – קפיצת מדרגה בארכיטקטורת הזיכרון
ה-Qualcomm AI250, שצפוי להגיע שנה לאחר ה-AI200, משמר את המבנה הבסיסי אך מוסיף ארכיטקטורת זיכרון מתקדמת המבוססת על Near-Memory Computing.
הטכנולוגיה מספקת לפי החברה קפיצת מדרגה ביעילות ובביצועים עבור עומסי עבודה של AI, עם שיפור של למעלה מפי 10 ברוחב הפס האפקטיבי של הזיכרון וצריכת חשמל נמוכה בהרבה.
בנוסף, ה-AI250 יתמוך ביכולת Disaggregated Inference, המאפשרת שיתוף דינמי של משאבי חישוב וזיכרון בין כרטיסים – תכונה משמעותית שמאפשרת ניצול יעיל יותר של החומרה תוך עמידה בדרישות ביצועים ועלות של הלקוחות.
קוואלקום מציבה את המערכת הזו כפתרון יעיל במיוחד למודלי Transformer גדולים, תוך שמירה על אותם מאפיינים תרמיים, קירור, אבטחה וסקאלביליות כמו ב-AI200.
מערכת תוכנה
מעבר לחומרה, קוואלקום בונה מערכת תוכנה ברמת “הייפרסקיילר” (Hyperscaler), המכסה את כל השכבות מרמת האפליקציה ועד רמת התוכנה המערכתית, ומותאמת במיוחד ל-Inference של AI.
המערכת תומכת במסגרות למידת מכונה מובילות כמו PyTorch, ONNX, vLLM, LangChain ו-CrewAI, ומאפשרת פריסה חלקה של מודלים.
זמינות
ה-Qualcomm AI200 צפוי להיות זמין מסחרית במהלך 2026, בעוד שה-Qualcomm AI250 צפוי להגיע ב-2027.