מיקרוסופט הכריזה באמצעות Microsoft AI (MAI), חטיבת הבינה המלאכותית של החברה, על MAI-Image-1, מודל הבינה המלאכותית הראשון שלה ליצירת תמונות, שפותח במלואו בתוך החברה.
המודל החדש מצטרף למאמציה של מיקרוסופט להפחית את התלות שלה ב-OpenAI ולפתח טכנולוגיות AI עצמאיות, כאשר המחולל הצליח להיכנס במהירות לרשימת עשרת המודלים המובילים בפלטפורמת ה-LMArena.
מודלי ה-MAI הקודמים של מיקרוסופט
בעוד שמיקרוסופט נשענה עד כה בעיקר על מודלי ה-GPT של חברת OpenAI עבור הכלים אותם הציעה לציבור הרחב באמצעות Copilot, החברה הציגה בקיץ האחרון את שני המודלים הראשונים שלה תחת חטיבת MAI.
מטרתה של החברה היא להפוך את ה-AI לכלי נגיש, אחראי ומותאם אישית לכל אדם, תוך שילובו במוצרים המגיעים למיליארדי משתמשים ברחבי העולם.
מודלי ה-MAI הקודמים כוללים את:
- MAI-Voice-1 – מודל דיבור המסוגל לייצר קול טבעי ואקספרסיבי ברמה גבוהה, ומייצר דקת אודיו בפחות משנייה על כרטיס גרפי יחיד.
- MAI-1-preview – מודל הבסיס הראשון של מיקרוסופט, שפועל בגישת “Mixture-of-Experts” ועבר אימון על כ-15,000 כרטיסי NVIDIA H100. מודל vמתמקד ביכולות הבנה, ביצוע הוראות ומתן תשובות לשאילתות יומיומיות.

MAI-Image-1: ביצועים מרשימים מהיום הראשון
למרות היותו מודל חדש, MAI-Image-1 הצליח להגיע לעשירייה המובילה ב-LMArena – פלטפורמת השוואה לדגמי AI שבה משתמשים מדרגים ומשווים תוצאות ממערכות שונות.
הישג זה מדגים את היכולות הגבוהות של המודל כבר בשלב ההשקה הראשוני, ולפי מיקרוסופט, המודל מצטיין במיוחד ביצירת תמונות פוטוריאליסטיות.
הוא מטפל בצורה טובה במיוחד באלמנטים ויזואליים מורכבים כמו:
- תאורה טבעית, השתקפויות ואפקטי אור
- נופים ופרטים טבעיים
- יצירת תמונות מציאותיות במהירות גבוהה

זמינות ואינטגרציה
כרגע, המודל זמין לבדיקה ציבורית ב-LMArena, כאשר מיקרוסופט הודיעה כי MAI-Image-1 ישולב בקרוב ב-Copilot וב-Bing Image Creator, מחולל התמונות שזמין דרך בינג.