מיקרוסופט מכריזה על סדרת מודלי MAI חדשים, בהם ה-MAI-Thinking-1

כנס Build 2026 (מקור מיקרוסופט) כנס Build 2026 (מקור מיקרוסופט)

⭐ נקודות עיקריות

  • מיקרוסופט הציגה את סדרת מודלי MAI, הכוללת את מודל החשיבה החדש MAI-Thinking-1 שמיועד למשימות מורכבות.
  • המודלים פותחו באופן עצמאי על ידי החברה ללא התבססות על נתונים ממודלים של חברות אחרות.
  • סדרת המודלים כוללת גם פתרונות חדשים לעיבוד תמונות מתקדם, תמלול דיבור רב-לשוני, יצירת קול וכתיבת קוד.
  • המודלים זמינים כעת למפתחים דרך Microsoft Foundry ו-Azure Speech, כאשר מודל הקידוד משולב ב-Copilot.

מיקרוסופט (Microsoft) חשפה סדרת מודלי AI חדשים ממשפחת ה-MAI של החברה, במהלך כנס המפתחים Build 2026. במרכז ההכרזה עומד מודל הדגל MAI-Thinking-1, מודל החשיבה הראשון של החברה, לצד שורת מודלים ייעודיים לעיבוד תמונה, קול, תמלול וקוד.

משפחת המודלים החדשה נועדה לספק למפתחים וארגונים כלים ממוקדים ויעילים למגוון רחב של משימות, תוך הרחבת סל הפתרונות העצמאיים של מיקרוסופט.

ההשקה מסמנת את הגברת העצמאות של החברה בתחום מודלי הבסיס, אותם היא מציעה כעת לצד השותפות ארוכת השנים שלה עם OpenAI.

הכירו את מודל הדגל: MAI-Thinking-1

החידוש הבולט ביותר בהכרזה הוא MAI-Thinking-1, מודל שפה גדול (LLM) בגודל בינוני המיועד לפתרון בעיות מורכבות, ניתוח מסמכים ארוכים וכתיבת קוד.

המודל פותח מאפס על ידי מיקרוסופט ואומן על נתונים נקיים המותאמים לסביבות אנטרפרייז, ללא שימוש במידע שזוקק ממודלים של חברות אחרות (Zero Distillation).

המודל מבוסס על ארכיטקטורת מומחים מעורבים (Mixture of Experts), המפעילה רק את חלקי המודל הנדרשים באופן ספציפי עבור כל משימה, במטרה לשמור על עלויות עיבוד נמוכות.

לדברי מיקרוסופט, MAI-Thinking-1 מציג ביצועים המקבילים למודל ה-Claude Opus 4.6 במבחני קידוד מקצועיים, ומספק תוצאות דומות למודל ה-Sonnet 4.6, אך בעלות הפעלה נמוכה משמעותית.

עיבוד תמונה: משפחת MAI-Image-2.5

מיקרוסופט הציגה בנוסף את מודל יצירת התמונות MAI-Image-2.5, המיועד לצוותי קריאייטיב, לצד גרסת Flash חסכונית ומהירה יותר. המודלים תומכים ביצירת תמונות מטקסט ובעריכת תמונות קיימות, תוך דגש על שליטה ועקביות ויזואלית לצרכים מסחריים.

לפי החברה, המודל מאפשר לשמור על זהות עקבית של דמויות ופנים לאורך תמונות שונות, ומציע שליטה מתקדמת בסגנון, תאורה ועיצוב.

בנוסף, הוא מאפשר לשלב טקסט, לוגואים וגרפיקה ישירות בתוך התמונות, באופן המותאם להכנת מצגות וחומרים שיווקיים (PPT-ready).

MAI-Image-2.5 (מקור מיקרוסופט)
MAI-Image-2.5 (מקור מיקרוסופט)

קול, תמלול וקוד

בתחום האודיו, החברה הציגה את מודל ה-MAI-Voice-2, מודל המרת טקסט לדיבור (TTS) התומך ביותר מ-15 שפות.

המודל מאפשר שיבוט קול תוך שמירה על זהות קולית ייחודית, וכולל אפשרות להגדרת סגנון דיבור וטון באמצעות דגימת שמע קצרה כרפרנס. גרסת Flash של מודל זה צפויה להגיע בהמשך.

לצד זאת, נחשף מודל התמלול MAI-Transcribe-1.5, המציע תמיכה ב-43 שפות. מיקרוסופט מציינת כי המודל כולל שיפור בדיוק התמלול בסביבות רועשות ומאפשר הזנת מונחים מקצועיים או שמות מותגים מראש, כדי למנוע שגיאות כתיב במילים ייעודיות. לטענתה, המודל מסוגל לבצע תמלול במהירות של עד פי 5 בהשוואה למודלים מתחרים בשוק.

בתחום הפיתוח, מיקרוסופט שילבה את מודל ה-MAI-Code-1-Flash ישירות בתוך GitHub Copilot וסביבת הפיתוח Visual Studio Code, כמודל מהיר ויעיל להשלמת קוד.

מחירים וזמינות

המודלים החדשים מבית מיקרוסופט זמינים כעת למפתחים וארגונים לשימוש בממשק פיתוח (API).

השוואת מפרטים