OpenAI השיקה את ChatGPT Agent, סוכן בינה מלאכותית מתקדם המסוגל לבצע משימות מורכבות בעבור המשתמשים באמצעות “מחשב וירטואלי” משלו.
הסוכן החדש יכול לנווט באתרי אינטרנט, לנהל יומנים, ליצור מצגות, טבלאות ואפילו לבצע רכישות באינטרנט – הכל בהתבסס על הוראות של המשתמש בשפה טבעית.
סוכני בינה מלאכותית נחשבים כ”דבר הגדול הבא” בתחום ה-AI, כאשר בניגוד לסוכן ה-Operator שיכול ללחוץ ולנווט באתרי אינטרנט, וסוכן ה-Deep Research המתמחה במחקר, סוכן ה-ChatGPT Agent החדש, המשלב בין שניהם, נועד לשימוש כללי ונרחב יותר.
יכולות מתקדמות ועבודה עם כלים מרובים
- על מנת לבצע את כלל הפעולות שלו, סוכן ה-ChatGPT Agent משתמש במחשב וירטואלי הכולל מגוון כלים:
- דפדפן ויזואלי לאינטראקציה עם אתרים
- דפדפן טקסטואלי לחיפושים פשוטים יותר
- טרמינל
- גישה ישירה ל-API של שירותים שונים
הסוכן מסוגל להתחבר לאפליקציות שונות כמו Gmail ו-GitHub דרך ChatGPT connectors, מה שמאפשר לו לגשת למידע רלוונטי ולהשתמש בו במשימות.
בהמשך להדלפה מוקדמת בנושא, התייחסה OpenAI גם לדיווח שהעיד על עבודתה ביצירת מסמכים באופן שיתחרה בחלק מתוכנות אופיס של מיקרוסופט, כאשר אישרה כי סוכן ה-ChatGPT Agent מסוגל גם ליצור מסמכים בפורמטים מוכרים כמו Excel ו-PowerPoint, אותם ניתן להוריד כקבצים לעריכה נוספת.
לדוגמה, ניתן לבקש ממנו להכין טבלת הוצאות חודשית בקובץ אקסל או לבנות מצגת שיווקית עם שקפים מעוצבים, והסוכן יפיק את הקבצים באופן עצמאי.
בבדיקת הביצועים SpreadsheetBench (מבחן לגליונות אלקטרוניים), הסוכן הדגים יכולות מרשימות עם 45.5% הצלחה בעריכת גיליונות אלקטרוניים, יותר מכפול לעומת Microsoft Copilot שעמד על 20% בלבד.
הסוכן מיועד למשימות מורכבות כמו “תסתכל על היומן שלי ותכין לי תדרוך על פגישות עם לקוחות בהתבסס על חדשות אחרונות“, “תכנן ותקנה מרכיבים להכנת ארוחת בוקר יפנית לארבעה אנשים” או “תנתח שלושה מתחרים ותכין מצגת“.
הסוכן יכול לבצע את כל המשימות האלו מתחילה ועד סוף, תוך שהוא מבקש אישור מהמשתמש לפני ביצוע פעולות בעלות השלכות כמו רכישות או שליחת אימיילים.
בעת הצגת סוכן ה-ChatGPT בשידור חי אמש (ה’, 17.9), התייחס לכך באופן ספציפי מנכ”ל החברה, סם אלטמן, וציין כי למרות שהחברה הטמיעה בסוכן החדש לא מעט מנגנוני הגנה, כנראה שעדיף שבשלב זה לא ניתן לו את כרטיס האשראי שיבצע גם את הרכישות בפועל, או שלכל הפחות נשגיח עליו טוב יותר.
ChatGPT can now do work for you using its own computer.
Introducing ChatGPT agent—a unified agentic system combining Operator’s action-taking remote browser, deep research’s web synthesis, and ChatGPT’s conversational strengths. pic.twitter.com/7uN2Nc6nBQ
— OpenAI (@OpenAI) July 17, 2025
השוואת ביצועים למתחרים
סוכן ה-ChatGPT Agent משתמש במודל חדש של OpenAI המצליח להציג ביצועים מרשימים עם ציון של 41.6% במבחן ה-Humanity’s Last Exam, מבחן ידע מקצועי כללי שבודק ביצועי AI במגוון נושאים ברמת מומחים. זהו שיפור משמעותי לעומת הדגמים הקודמים o3 ו-o4-mini שהשיגו 20.3% ו-23.0% בהתאמה.
במבחן המתמטיקה המתקדם FrontierMath, ה-ChatGPT Agent השיג 27.4% דיוק כשיש לו גישה לכלים, לעומת 6.3% של o4-mini.
בטיחות ופרטיות
בשל היכולות המורחבות של הסוכן החדש, OpenAI הפעילה אמצעי בטיחות מוגברים. החברה מסווגת את ה-ChatGPT Agent כבעל “יכולות ביולוגיות וכימיות גבוהות” (High Biological and Chemical capabilities) ומפעילה מערכת ניטור בזמן אמת לזיהוי בקשות בעייתיות. בנוסף, החברה השביתה את תכונת הזיכרון של ChatGPT לסוכן זה כדי למנוע ניצול לרעה.
הסוכן מבקש אישור מפורש מהמשתמש לפני ביצוע פעולות בעלות השלכות פוטנציאליות, ודורש פיקוח פעיל במשימות רגישות כמו שליחת אימיילים. OpenAI גם מדגישה שהמשתמש יכול להתערב בכל שלב, לעצור את המשימה או להשתלט על הדפדפן.
זמינות
סוכן ה-ChatGPT Agent זמין למנויי Pro, Plus ו-Team של OpenAI, תחילה למשתמשי “פרו” ולאחר מכן בהדרגה גם לאחרים, כאשר משתמשי “פרו” מקבלים 400 הודעות לחודש ואילו משתמשי Plus ו-Team מקבלים 40 הודעות חודשיות.
אירוע הצגת ה-ChatGPT Agent (כ-25 דקות)

