⭐ נקודות עיקריות
- גוגל חשפה את TranslateGemma, סדרת מודלים פתוחים לתרגום המבוססת על משפחת Gemma 3 ותומכת ב-55 שפות.
- הסדרה כוללת שלושה דגמים בגדלים של 4B, 12B ו-27B המותאמים לריצה על מכשירים ניידים, מחשבים ותשתיות ענן.
- המודלים החדשים תומכים בשפה העברית, אך בשלב זה התמיכה מוגבלת לתרגום מאנגלית לעברית בלבד ולא באופן דו-כיווני.
- המודלים זמינים כעת להורדה חופשית עבור מפתחים וחוקרים דרך הפלטפורמות Kaggle ו-Hugging Face.
גוגל (Google) הכריזה על TranslateGemma, סדרה חדשה של מודלי תרגום פתוחים המבוססים על משפחת מודלי ה-Gemma 3.
הסדרה החדשה נועדה לספק פתרונות תרגום יעילים ומדויקים למפתחים וחוקרים, תוך שמירה על גמישות תפעולית גבוהה.
השקת המודל החדש מגיעה בסמיכות להצגת ChatGPT Translate של OpenAI, כאשר המודל החדש מתמקד בהנגשת יכולות תרגום מתקדמות למגוון רחב של פלטפורמות באמצעות ארכיטקטורה המאפשרת תקשורת ב-55 שפות שונות, בהן גם עברית (אך רק בתרגום מאנגלית בלבד ולא תרגום דו-כיווני).
התאמה לשימושים שונים: גרסאות המודל
על מנת לספק מענה למגוון רחב של סביבות עבודה, סדרת TranslateGemma פותחה בשלושה גדלים שונים, כאשר כל אחד מהם מותאם לתרחיש שימוש ספציפי:
- TranslateGemma 4B – הגרסה הקומפקטית ביותר עם 4 מיליארד פרמטרים, אשר עברה אופטימיזציה ייעודית למכשירי קצה ומובייל. גרסה זו מאפשרת הרצת תרגום מהירה וחסכונית בסוללה ישירות על המכשיר.
- TranslateGemma 12B – גרסה המיועדת עבור מפתחים וחוקרים העובדים על חומרה סטנדרטית. מודל זה תוכנן לרוץ בצורה חלקה על מחשבים ניידים סטנדרטיים, ומביא יכולות ברמת מחקר (Research-grade) לסביבות פיתוח מקומיות ללא צורך בשרתים חיצוניים.
- TranslateGemma 27B – הגרסה המתקדמת ביותר של המודל שנבנתה עבור דיוק מקסימלי (Maximum Fidelity) ומיועדת לרוץ על תשתיות ענן חזקות, כגון מעבד גרפי יחיד מסוג H100 או יחידות TPU.
טכנולוגיה וחדשנות
מודלי TranslateGemma נבנו על בסיס הידע שנצבר בפיתוח מודלי Gemini של החברה. התהליך כלל כוונון עדין (Fine-tuning) דו-שלבי שנועד “לזקק” את האינטואיציה של המודלים הגדולים לתוך המודלים הפתוחים החדשים.
השלב הראשון כלל אימון מונחה (Supervised Fine-Tuning) על בסיס מאגר מידע מגוון הכולל טקסטים שתורגמו על ידי בני אדם ורכיבים סינתטיים מ-Gemini.
בשלב השני, יושמה למידת חיזוק (Reinforcement Learning) המשתמשת במודלי תגמול מתקדמים (כגון MetricX-QE ו-AutoMQM) כדי לכוון את התוצאות לתרגומים טבעיים ומדויקים יותר.
ביצועים
אחד ההישגים המשמעותיים בסדרה החדשה הוא יחס הביצועים-לגודל. על פי נתוני החברה, מודל ה-TranslateGemma בגודל 12B מצליח לעקוף בביצועיו את מודל הבסיס המקורי של Gemma 3 בגודל 27B.
משמעות הדבר היא שמפתחים יכולים להשיג איכות תרגום גבוהה תוך שימוש בפחות ממחצית משאבי הזיכרון והעיבוד שהיו נדרשים בעבר.
בנוסף, המודל הקטן ביותר (4B) מציג ביצועים המתחרים במודל ה-12B המקורי, נתון המדגיש את יעילות תהליך האימון החדש.
![]()
זמינות
מודלי ה-TranslateGemma החדשים זמינים להורדה מ-Kaggle ו-Hugging Face.