⭐ נקודות עיקריות
- גוגל השיקה את Gemini 3 Deep Think, מודל המתמקד ביכולות הסקה למדע והנדסה.
- המודל השיג ציונים ברמת מדליית זהב באולימפיאדות הבינלאומיות למתמטיקה, פיזיקה וכימיה.
- ביצועי שיא נרשמו במבחנים Humanity’s Last Exam ו-ARC-AGI-2.
- זמין כעת למנויי Google AI Ultra ולחוקרים נבחרים דרך ה-API.
גוגל (Google) הכריזה על ה-Gemini 3 Deep Think, גרסה משודרגת של מודל ה-Gemini 3 המתמקד ביכולות חשיבה והסקה (Reasoning).
המודל החדש תוכנן במיוחד כדי להתמודד עם אתגרים מורכבים בתחומי המדע, המחקר וההנדסה, תוך שילוב בין ידע מדעי עמוק לבין שימושיות הנדסית יומיומית.
מאפיינים עיקריים
מודל ה-Deep Think החדש פותח בשיתוף פעולה צמוד עם מדענים וחוקרים כדי להתמודד עם אתגרי מחקר “מלוכלכים” – כאלו שבהם המידע חלקי או לא מאורגן.
בניגוד למודלים קודמים, הוא מתמקד ביכולת לזהות כשלים לוגיים דקים ולבצע חקירה מתמטית ברמת מחקר.
דוגמה ליכולותיו הוצגה על ידי ליסה קרבון, מתמטיקאית מאוניברסיטת ראטגרס (Rutgers), שהשתמשה במודל לבדיקת מאמר מתמטי טכני בתחום הפיזיקה של אנרגיות גבוהות.
המודל הצליח לזהות כשל לוגי עדין שחמק מעיניהם של הבודקים האנושיים בתהליך ביקורת העמיתים, מה שמדגים את הפוטנציאל שלו ככלי עזר למחקר אקדמי מתקדם.
מעבר לתיאוריה, גוגל שמה דגש על יכולות הנדסיות מעשיות. המודל מסוגל לנתח שרטוטים ידניים ולהמיר אותם לקבצים שמוכנים להדפסה בתלת-ממד, תוך שהוא מבין את המבנה המורכב שנדרש ליצירת האובייקט הפיזי.
ביצועים
גוגל הציגה נתונים שמעידים על קפיצת מדרגה משמעותית בביצועי המודל במבחנים המקובלים. ה-Deep Think הציג ביצועים ברמת “מדליית זהב” באולימפיאדה הבינלאומית למתמטיקה (IMO) לשנת 2025, וכעת הוא מרחיב את ההישג הזה גם לתחומי הפיזיקה והכימיה, עם תוצאות דומות בחלקים הכתובים של האולימפיאדות בתחומים אלו.
במבחן Humanity’s Last Exam, שנועד לבחון את גבולות המודלים המתקדמים ביותר, השיג המודל ציון של 48.4% (ללא שימוש בכלים חיצוניים), מה שמהווה סטנדרט חדש בתחום. בנוסף, המודל השיג ציון חסר תקדים של 84.6% במבחן ARC-AGI-2.
בתחום התכנות התחרותי, המודל הגיע לדירוג Elo של 3455 בפלטפורמת Codeforces, נתון המציב אותו בשורה אחת עם המתכנתים הטובים בעולם. בתחום הפיזיקה התיאורטית המתקדמת, הוא השיג ציון של 50.5% במבחן CMT-Benchmark.

יכולות נוספות
מעבר לפתרון מבחנים, Gemini 3 Deep Think מציג יכולות סוכניות (Agentic Capabilities) שמאפשרות לו לנהל מחקר מתמטי באופן עצמאי יותר.
הוא מסוגל לפרש נתונים מורכבים ולבצע מידול של מערכות פיזיקליות באמצעות קוד, מה שהופך אותו לכלי עזר עבור מהנדסים הנדרשים לבצע סימולציות מורכבות.
זמינות
המודל המעודכן זמין החל מהיום באפליקציית Gemini עבור מנויי התוכנית Google AI Ultra.