גוגל משיקה את Gemini 3.1 Pro עם שיפור משמעותי ביכולות החשיבה

Gemini 3.1 Pro קרדיט: Google

⭐ נקודות עיקריות

  • גוגל משיקה את Gemini 3.1 Pro עם שיפור משמעותי ביכולות הסקה (Reasoning).
  • ציון של 77.1% במבחן ARC-AGI-2 – יותר מפי שניים לעומת Gemini 3 Pro.
  • המודל זמין למפתחים, ארגונים ומשתמשים דרך Gemini, Vertex AI ו-NotebookLM.
  • כולל יכולות יצירה מתקדמות בקוד, כמו הפקת אנימציות SVG ישירות מטקסט.

גוגל (Google) הכריזה על Gemini 3.1 Pro, גרסה חדשה למודל הדגל שלה המיועדת לשפר את יכולות החשיבה והפתרון של מערכות בינה מלאכותית במשימות מורכבות.

המודל מהווה את שכבת האינטליגנציה המרכזית מאחורי עדכון Gemini 3 Deep Think שהוצג לאחרונה, וכעת מתחיל להגיע בפועל למוצרי החברה עבור משתמשים פרטיים, מפתחים וארגונים.

בניגוד לעדכונים המתמקדים בפיצ’רים נקודתיים, Gemini 3.1 Pro מתמקד בשדרוג יכולות הליבה – כלומר את האופן שבו המודל מנתח בעיות חדשות, מסיק מסקנות ומבצע פתרון רב-שלבי למצבים שאינם מבוססים על ידע קיים בלבד.

הכירו את Gemini 3.1 Pro

Gemini 3.1 Pro מבוסס על סדרת Gemini 3, אך מוגדר על ידי גוגל כבסיס אינטליגנטי מתקדם יותר למשימות מורכבות.

המטרה היא לא רק לספק תשובות, אלא להתמודד עם בעיות שבהן נדרש תהליך חשיבה מלא – שילוב מידע, בניית הסבר, או יצירת פתרון יצירתי.

בין היכולות של המודל החדש:

  • הפקת הסברים חזותיים וברורים לנושאים מורכבים.
  • איחוד מידע ממקורות שונים לתצוגה אחת ברורה.
  • סיוע בפרויקטים יצירתיים וטכניים הדורשים תכנון רב-שלבי.

אחת ההדגמות הבולטות שהציגה גוגל היא יצירת אנימציות SVG מבוססות קוד ישירות מהנחיה טקסטואלית.

בניגוד לווידאו או תמונות מבוססות פיקסלים, מדובר בקוד נקי המאפשר קבצים קלים במיוחד השומרים על חדות מלאה בכל קנה מידה – יתרון משמעותי עבור פיתוח אתרים וממשקים.

ביצועים

השיפור המרכזי ב-Gemini 3.1 Pro נמדד ביכולות הסקה מתקדמות. במבחן ARC-AGI-2, שנועד לבדוק פתרון דפוסי לוגיקה חדשים לחלוטין ולא ידע שנלמד מראש, השיג המודל ציון מאומת של 77.1%.

לשם השוואה, Gemini 3 Pro הגיע ל-31.1% בלבד – כלומר שיפור של יותר מפי שניים ביכולת ההתמודדות עם בעיות חדשות.

גם במבחנים נוספים נרשמה התקדמות:

  • 94.3% במבחן GPQA Diamond לידע מדעי.
  • 80.6% ב-SWE-Bench Verified למשימות קוד סוכניות.
  • 68.5% ב-Terminal-Bench 2.0 לפיתוח מבוסס טרמינל.
  • 92.6% במבחן MMLU להבנה רב-תחומית.

הנתונים מצביעים על מיקוד ברור של גוגל בשיפור יכולות Reasoning ולא רק הרחבת ידע או מהירות תגובה.

השוואת ביצועים (קרדיט: Google)
השוואת ביצועים (קרדיט: Google)

יכולות נוספות

Gemini 3.1 Pro מיועד במיוחד לסביבות עבודה מתקדמות הכוללות תהליכים מבוססי סוכנים (Agentic Workflows) – מערכות שבהן מודל הבינה המלאכותית מבצע רצף פעולות עצמאי לאורך זמן.

המודל משתלב עכשיו בפלטפורמות הפיתוח של גוגל:

  • Gemini API דרך Google AI Studio.
  • פלטפורמת הפיתוח מבוססת הסוכנים Google Antigravity.
  • Android Studio ו-Gemini CLI.
  • Vertex AI ו-Gemini Enterprise לארגונים.

לדברי החברה, גרסת ה-Preview הנוכחית נועדה לאפשר בדיקה של שיפורים אלו לפני השקה רחבה יותר, במיוחד בתחומים הדורשים אוטומציה מורכבת ותהליכי עבודה ארוכים.

זמינות

Gemini 3.1 Pro מתחיל להיפרס כעת במספר ערוצים:

  • למשתמשים פרטיים דרך אפליקציית Gemini ו-NotebookLM.
  • למנויי Google AI Pro ו-Ultra עם מגבלות שימוש גבוהות יותר.
  • למפתחים וארגונים בגרסת Preview דרך Vertex AI, AI Studio ו-Gemini API.

המודל עדיין נמצא בשלב תצוגה מוקדמת (Preview), כאשר גוגל מציינת כי שיפורים נוספים צפויים להגיע עוד לפני שתהיה זמינות כללית מלאה.

השוואת מפרטים