גוגל (Google) הציגה מגוון שיפורים ליכולות ה-AI במכשירי האנדרואיד כחלק מכנס המפתחים השנתי Google I/O 2024, בהם יכולות חדשות ל-Gemini, העוזר החכם העדכני של גוגל לאנדרואיד, המקבל אפשרות לגרירת תוכן ממנו לאפליקציות שונות, אפשרות לשאול שאלות על סרטוני וידאו וקבצי PDF, זאת לצד הפיכת פיצ’ר החיפוש Circle to Search למסייע בהכנת שיעורי בית בפיזיקה ומתמטיקה ועוד.
עם השקת אפליקציית ה-Gemini הסלולרית מוקדם יותר השנה, גוגל סימנה למעשה את סוף החיים לעוזרת ה-Google Assistant המוכרת למשתמשי אנדרואיד והחלפתה בפתרון ה-AI המתקדם יותר של החברה, שנועד לתת מענה רחב ומקיף יותר למשתמשים.
גוגל צפויה להעמיק את השילוב בין Gemini לאנדרואיד ולאפשר למשתמשים לבצע פעולות מתקדמות יותר, דוגמת האפשרות לגרור תמונה אותה הם יצרו באמצעות Gemini אל תוך אפליקציית ה-Gmail או ההודעות של גוגל על מנת לשלוח אותה למתמשים אחרים.
דוגמה נוספת לכך היא התכונה “לשאול את הוידאו” (Ask this video), המאפשרת לחפש מידע על סרטון יוטיוב מסויים, או “לשאול את ה-PDF”, המאפשרת למשתמשים לשאול את Gemini שאלות לגבי תוכן בקבצי PDF, כל זאת ישירות מהמכשיר.

Circle to Search כסייען שיעורי בית חכם
אחד מפיצ’רי החיפוש המסקרנים ביותר של גוגל למכשירי האנדרואיד הגיע בתור פיצ’ר ה-Circle to Search או “מקיפים ומחפשים”, שהושק לצד סדרת מכשירי ה-Galaxy S24 של סמסונג ושולב גם בסדרת מכשירי הפיקסל של גוגל עצמה, פיצ’ר המאפשר לבצע חיפוש מתקדם באמצעות סימון פרטי מידע על המסך או תרגום שלהם.
מעתה הפיצ’ר יוכל לשמש גם כמסייע בהכנת שיעורי בית בעבור המשתמשים, זאת לאחר שהחברה הטמיעה לתוכו את מודל ה-LearnLM, משפחת מודלי AI המיועדים ללמידה ויוכלו לעזור למשתמשים לפתור בעיות שונות בפיזיקה ומתמטיקה עם הדרכה שלב אחר שלב בפתרון הבעיה. הפיצ’ר יתמוך בהמשך גם בפתרון נוסחאות, דיאגרמות, גרפים ועוד.
מודל ה-Gemini Nano משדרג את פיצ’ר ה-TalkBack
אחד מפתרונות הנגישות השונים המובנים במערכת האנדרואיד של גוגל הוא TalkBack (“דבר בחזרה”), פיצ’ר יעודי בעבור משתמשים בעלי לקויות ראיה, המאפשר להם לבצע פעולות שונות במכשיר או לקבל תיאור של המידע על המסך עם האפשרות “קורא מסך קולי”.
עם זאת, לא מדובר על פיצ’ר מושלם מאחר שהוא מתבסס על תיוג של יוצרי התוכן המקוון על מנת להקריא אותו למשתמשים, כאשר לפי גוגל משתמשי TalkBack נתקלים בממוצע ב-90 תמונות מדי יום ללא תיוג מתאים, שמונע מהם להבין את התוכן שעל המסך. כאן נכנס לשימוש מודל ה-Gemini Nano הזעיר של גוגל, המסוגל להבין את התוכן במסך גם מבלי שקיים תיוג מתאים ולתאר אותו בעבור המשתמש.
זיהוי הונאות טלפון באמצעות AI
בעוד שזהו פיצ’ר ה-AI האחרון ברשימה, הוא סביר למדי גם השימושי ביותר, במיוחד בעבור משתמשים מבוגרים יותר הנחשבים לאוכלוסיה הפגיעה יותר להונאות טלפון, תחום שמסב נזק שנתי של של מעל מיליארד דולר.
כעת גוגל בוחנת שימוש ב-Gemini Nano על מנת לנטר שיחות ולזהות דפוסי שיחה חשודים העשויים להצביע על כך שלא מדובר בשיחה לגיטימית אלא בניסיון הונאה.
מקרים בהם הפיצ’ר יכנס לפעולה כוללים לדוגמה בקשות של המתקשר לבצע תשלום עם כרטיסי מתנה או לספק מידע אישי כמו קוד אימות או סיסמה. הפיצ’ר יופעל באופן מקומי על גבי המכשיר ויציג למשתמש התראה במידה שהוא חושד כי מדובר בניסיון הונאה.
