מיקרוסופט MAI: מודל החשיבה הראשון של החברה ושישה נוספים

⭐ נקודות עיקריות

מיקרוסופט הציגה את סדרת מודלי MAI, הכוללת את מודל החשיבה החדש MAI-Thinking-1 שמיועד למשימות מורכבות.
המודלים פותחו באופן עצמאי על ידי החברה ללא התבססות על נתונים ממודלים של חברות אחרות.
סדרת המודלים כוללת גם פתרונות חדשים לעיבוד תמונות מתקדם, תמלול דיבור רב-לשוני, יצירת קול וכתיבת קוד.
המודלים זמינים כעת למפתחים דרך Microsoft Foundry ו-Azure Speech, כאשר מודל הקידוד משולב ב-Copilot.

מיקרוסופט (Microsoft) חשפה סדרת מודלי AI חדשים ממשפחת ה-MAI של החברה, במהלך כנס המפתחים Build 2026. במרכז ההכרזה עומד מודל הדגל MAI-Thinking-1, מודל החשיבה הראשון של החברה, לצד שורת מודלים ייעודיים לעיבוד תמונה, קול, תמלול וקוד.

משפחת המודלים החדשה נועדה לספק למפתחים וארגונים כלים ממוקדים ויעילים למגוון רחב של משימות, תוך הרחבת סל הפתרונות העצמאיים של מיקרוסופט.

ההשקה מסמנת את הגברת העצמאות של החברה בתחום מודלי הבסיס, אותם היא מציעה כעת לצד השותפות ארוכת השנים שלה עם OpenAI.

הכירו את מודל הדגל: MAI-Thinking-1

החידוש הבולט ביותר בהכרזה הוא MAI-Thinking-1, מודל שפה גדול (LLM) בגודל בינוני המיועד לפתרון בעיות מורכבות, ניתוח מסמכים ארוכים וכתיבת קוד.

המודל פותח מאפס על ידי מיקרוסופט ואומן על נתונים נקיים המותאמים לסביבות אנטרפרייז, ללא שימוש במידע שזוקק ממודלים של חברות אחרות (Zero Distillation).

המודל מבוסס על ארכיטקטורת מומחים מעורבים (Mixture of Experts), המפעילה רק את חלקי המודל הנדרשים באופן ספציפי עבור כל משימה, במטרה לשמור על עלויות עיבוד נמוכות.

לדברי מיקרוסופט, MAI-Thinking-1 מציג ביצועים המקבילים למודל ה-Claude Opus 4.6 במבחני קידוד מקצועיים, ומספק תוצאות דומות למודל ה-Sonnet 4.6, אך בעלות הפעלה נמוכה משמעותית.

עיבוד תמונה: משפחת MAI-Image-2.5

מיקרוסופט הציגה בנוסף את מודל יצירת התמונות MAI-Image-2.5, המיועד לצוותי קריאייטיב, לצד גרסת Flash חסכונית ומהירה יותר. המודלים תומכים ביצירת תמונות מטקסט ובעריכת תמונות קיימות, תוך דגש על שליטה ועקביות ויזואלית לצרכים מסחריים.

לפי החברה, המודל מאפשר לשמור על זהות עקבית של דמויות ופנים לאורך תמונות שונות, ומציע שליטה מתקדמת בסגנון, תאורה ועיצוב.

בנוסף, הוא מאפשר לשלב טקסט, לוגואים וגרפיקה ישירות בתוך התמונות, באופן המותאם להכנת מצגות וחומרים שיווקיים (PPT-ready).

קול, תמלול וקוד

בתחום האודיו, החברה הציגה את מודל ה-MAI-Voice-2, מודל המרת טקסט לדיבור (TTS) התומך ביותר מ-15 שפות.

המודל מאפשר שיבוט קול תוך שמירה על זהות קולית ייחודית, וכולל אפשרות להגדרת סגנון דיבור וטון באמצעות דגימת שמע קצרה כרפרנס. גרסת Flash של מודל זה צפויה להגיע בהמשך.

לצד זאת, נחשף מודל התמלול MAI-Transcribe-1.5, המציע תמיכה ב-43 שפות. מיקרוסופט מציינת כי המודל כולל שיפור בדיוק התמלול בסביבות רועשות ומאפשר הזנת מונחים מקצועיים או שמות מותגים מראש, כדי למנוע שגיאות כתיב במילים ייעודיות. לטענתה, המודל מסוגל לבצע תמלול במהירות של עד פי 5 בהשוואה למודלים מתחרים בשוק.

בתחום הפיתוח, מיקרוסופט שילבה את מודל ה-MAI-Code-1-Flash ישירות בתוך GitHub Copilot וסביבת הפיתוח Visual Studio Code, כמודל מהיר ויעיל להשלמת קוד.

מחירים וזמינות

המודלים החדשים מבית מיקרוסופט זמינים כעת למפתחים וארגונים לשימוש בממשק פיתוח (API).

מיקרוסופט מכריזה על סדרת מודלי MAI חדשים, בהם ה-MAI-Thinking-1

הכירו את מודל הדגל: MAI-Thinking-1

עיבוד תמונה: משפחת MAI-Image-2.5

קול, תמלול וקוד

מחירים וזמינות

גאדג’טי מסקר: ASUS ROG Zephyrus Duo 2026 - מפלצת עם 2 מסכי OLED

גאדג’טי מסקר: ASUS Zenbook A14 2026 - נייד Snapdragon X2 Elite עם 33 שעות סוללה

Apple iPhone 16 Pro

Apple iPhone 16 Pro Max

Google Pixel 8 Pro

Apple iPhone 15 Pro Max

מיקרוסופט מכריזה על סדרת מודלי MAI חדשים, בהם ה-MAI-Thinking-1

הכירו את מודל הדגל: MAI-Thinking-1

עיבוד תמונה: משפחת MAI-Image-2.5

קול, תמלול וקוד

מחירים וזמינות

עוקבים? כל החדשות מגאדג'טי >>

גאדג’טי מסקר: ASUS ROG Zephyrus Duo 2026 - מפלצת עם 2 מסכי OLED

גאדג’טי מסקר: ASUS Zenbook A14 2026 - נייד Snapdragon X2 Elite עם 33 שעות סוללה

Apple iPhone 16 Pro

Apple iPhone 16 Pro Max

Google Pixel 8 Pro

Apple iPhone 15 Pro Max