שיאומי מצטרפת למרוץ ה-AI ומציגה את מודל ה-MiMo

חנות שיאומי באתונה צילום: אופק ביטון

שיאומי (Xiaomi) הכריזה על MiMo, מודל השפה הגדול (LLM) הראשון של החברה בגודל של 7 מיליארד פרמטרים, המגיע כפתרון קוד פתוח עם התמקדות במשימות הסקה (reasoning) ומציג ביצועים מרשימים בתחומי חישובים מתמטיים ויצירת קוד.

שיאומי מצטרפת אל מירוץ החימוש הגדול בתחום ה-AI עם הצגת מודל ה-MiMo החדש, אותו ניתן לשער כי החברה תשלב בשלב מאוחר יותר בשלל מוצריה.

המודל הזעיר מגיע בגודל של 7 מיליארד פרמטרים ומצליח להציג ביצועים הדומים לאלו של מודל ה-o1-mini של OpenAI ואף ביצועים דומים או טובים יותר ממודלים בגודל של 32 מיליארד פרמטרים.

את מודל ה-MiMo-7B החדש של שיאומי יהיה ניתן למצוא בארבע גרסאות שונות:

  • MiMo-7B-Base – גרסת הבסיס של מודל ה-MiMo.
  • MiMo-7B-RL-Zero – מודל המבוסס על גרסת הבסיס אך עבר “למידת חיזוק” RL (ר”ת Reinforcement Learning).
  • MiMo-7B-SFT – מודל בסיס שעבר “כיול עדין” SFT (ר”ת Supervised fine-tuning).
  • MiMo-7B-RL – גרסת מודל MiMo עם RL שאומן מגרסת ה-SFT ומציע ביצועים ברמה תואמת ל-o1-mini של OpenAI.

ביצועי Xiaomi MiMo

בעוד שמודל ה-MiMo מגיע בגודל של 7 מיליארד פרמטרים בלבד, הוא מצליח להציג ביצועים מרשימים יחסית לגודל שלו, עם ביצועים טובים יותר ממודל ה-o1-mini של OpenAI ואף ביצועים טובים יותר ממודלי ה-DeepSeek-R1-Zero-32B של דיפסיק ו-Qwen2.5-32B-RL-Zero של עליבאבא, הגדולים ממנו פי כמה עם גרסת ה-MiMo-7B-RL.

ניתן למצוא מידע נוסף ולהוריד את מודל ה-MiMo החדש של שיאומי מ-Hugging Face ו-GitHub.

השוואת מפרטים