שיאומי (Xiaomi) הכריזה על MiMo, מודל השפה הגדול (LLM) הראשון של החברה בגודל של 7 מיליארד פרמטרים, המגיע כפתרון קוד פתוח עם התמקדות במשימות הסקה (reasoning) ומציג ביצועים מרשימים בתחומי חישובים מתמטיים ויצירת קוד.
שיאומי מצטרפת אל מירוץ החימוש הגדול בתחום ה-AI עם הצגת מודל ה-MiMo החדש, אותו ניתן לשער כי החברה תשלב בשלב מאוחר יותר בשלל מוצריה.
המודל הזעיר מגיע בגודל של 7 מיליארד פרמטרים ומצליח להציג ביצועים הדומים לאלו של מודל ה-o1-mini של OpenAI ואף ביצועים דומים או טובים יותר ממודלים בגודל של 32 מיליארד פרמטרים.
את מודל ה-MiMo-7B החדש של שיאומי יהיה ניתן למצוא בארבע גרסאות שונות:
- MiMo-7B-Base – גרסת הבסיס של מודל ה-MiMo.
- MiMo-7B-RL-Zero – מודל המבוסס על גרסת הבסיס אך עבר “למידת חיזוק” RL (ר”ת Reinforcement Learning).
- MiMo-7B-SFT – מודל בסיס שעבר “כיול עדין” SFT (ר”ת Supervised fine-tuning).
- MiMo-7B-RL – גרסת מודל MiMo עם RL שאומן מגרסת ה-SFT ומציע ביצועים ברמה תואמת ל-o1-mini של OpenAI.
ביצועי Xiaomi MiMo
בעוד שמודל ה-MiMo מגיע בגודל של 7 מיליארד פרמטרים בלבד, הוא מצליח להציג ביצועים מרשימים יחסית לגודל שלו, עם ביצועים טובים יותר ממודל ה-o1-mini של OpenAI ואף ביצועים טובים יותר ממודלי ה-DeepSeek-R1-Zero-32B של דיפסיק ו-Qwen2.5-32B-RL-Zero של עליבאבא, הגדולים ממנו פי כמה עם גרסת ה-MiMo-7B-RL.
ניתן למצוא מידע נוסף ולהוריד את מודל ה-MiMo החדש של שיאומי מ-Hugging Face ו-GitHub.

