תרגום חי באוזניות: Google Translate משתדרג עם Gemini

תמונה: Google

⭐ נקודות עיקריות

  • גוגל משלבת את מודלי Gemini החדשים ב-Google Translate ומשפרת משמעותית את איכות התרגום.
  • השקה של תרגום דיבור-לדיבור חי באוזניות, עם שמירה על טון, קצב ואינטונציה.
  • שיפור ניכר בתרגום טקסטים מורכבים, כולל ניבים, סלנג וביטויים מקומיים.
  • הרחבת כלי תרגול ולמידת שפות בתוך אפליקציית Google Translate.

גוגל ממשיכה להרחיב את השימוש במודלי הבינה המלאכותית Gemini במוצריה, והפעם עם שדרוג משמעותי ל-Google Translate.

העדכון משלב יכולות תרגום מתקדמות לטקסט ולדיבור, לצד פיצ’רים חדשים שמטרתם לקרב את חוויית התרגום לאופן שבו בני אדם באמת מדברים ומבינים שפה.

תרגום טקסט חכם וטבעי יותר עם Gemini

אחת ההתקדמויות המרכזיות בעדכון החדש היא שיפור באיכות תרגום הטקסט, המבוסס כעת על יכולות ההבנה ההקשרית של Gemini.

במקום תרגום מילולי, המערכת מזהה הקשרים תרבותיים ולשוניים, כגון ניבים, ביטויים מקומיים וסלנג, ומספקת תרגום שמשקף את המשמעות האמיתית של המשפט.

כך למשל, ביטוי באנגלית כמו “stealing my thunder” מתורגם באופן שמבטא את אובדן הבכורה או תשומת הלב, ולא כתיאור מילולי.

השיפור הזה זמין כבר כעת בחיפוש גוגל ובאפליקציית Google Translate, בשלב ראשון בתרגום מאנגלית ולכמעט 20 שפות, בהן ספרדית, גרמנית, יפנית, סינית והינדי, גם באנדרואיד וגם ב-iOS.

תרגום דיבור-לדיבור חי באוזניות

החידוש הבולט ביותר מגיע בדמות תרגום דיבור-לדיבור (Speech-to-Speech) בזמן אמת, המופעל ישירות דרך אפליקציית Google Translate.

מדובר בחוויית בטא חדשה המאפשרת למשתמשים לחבר אוזניות, להפעיל מצב “Live translate” ולשמוע תרגום חי של הסביבה או של שיחה דו-כיוונית.

המערכת לא מסתפקת בהעברת המילים בלבד, אלא שומרת על הטון, ההדגשות והקצב של הדובר המקורי, מה שמקל להבין מי מדבר ומהי הכוונה הרגשית שמאחורי הדברים.

הפתרון הזה מתאים לשיחות אישיות, להרצאות, לטקסים ואפילו לצפייה בתכנים בשפה זרה בזמן אמת.

התרגום החי תומך ביותר מ-70 שפות ואלפי צמדי שפות, כולל זיהוי אוטומטי של השפה המדוברת, הבנת שיחות רב-לשוניות באותה סשן וסינון רעשי רקע לשימוש גם בסביבות רועשות.

בשלב זה הפיצ’ר זמין באנדרואיד בארצות הברית, מקסיקו והודו, עם הרחבה ל-iOS ולמדינות נוספות במהלך 2026.

הבסיס הטכנולוגי: Gemini Native Audio

מאחורי יכולות התרגום החדשות עומד Gemini 2.5 Flash Native Audio, מודל אודיו מתקדם של גוגל המיועד לאינטראקציות קוליות חיות.

המודל מציג שיפור בניהול שיחות מרובות שלבים, הבנת הוראות מורכבות ושמירה על רצף שיחה טבעי.

בזכות יכולות אלו, Gemini מצליח לתרגם דיבור בצורה רציפה, לזהות החלפת שפות באמצע שיחה ולשלב מידע הקשרי מבלי לפגוע בזרימה הקולית.

זהו אותו בסיס טכנולוגי שמניע גם סוכני קול חכמים ושירותים חיים נוספים של גוגל.

תרגול ולמידת שפות בתוך Google Translate

מעבר לתרגום עצמו, גוגל מרחיבה גם את כלי לימוד השפות באפליקציה. המשתמשים מקבלים כעת משוב מדויק יותר על תרגול דיבור, תרחישים מותאמים למצבים יומיומיים ומעקב אחרי רצף ימי הלמידה לצורך שמירה על עקביות.

כלי הלמידה זמינים כעת במדינות נוספות ותומכים בזוגות שפות חדשים, בהם גרמנית, פורטוגזית, איטלקית, רומנית ושבדית, לצד שפות כמו בנגלית וסינית מנדרינית.

בינה מלאכותית ב-Google Translate
תמונה: Google

לאן זה הולך?

השילוב העמוק של Gemini ב-Google Translate מסמן שינוי מהותי באופן בו עובד השירות – מעבר מתרגום טכני של מילים, להבנה של משמעות, הקשר וניואנסים אנושיים.

גוגל מציינת כי היא תמשיך לשפר את חוויית התרגום החי ולאפשר את השימוש בה גם במוצרים נוספים וב-API של Gemini במהלך 2026.

עבור משתמשים פרטיים, מטיילים ואנשי עסקים, מדובר בצעד נוסף לקראת עולם שבו מחסום השפה הופך לפחות ופחות מורגש.

השוואת מפרטים