חברת OpenAI מציגה עדכון משמעותי ל-Codex: סוכן AI לשליטה במחשב ודפדפן מובנה

Codex (מקור OpenAI) Codex (מקור OpenAI)

⭐ נקודות עיקריות

  • העדכון החדש הופך את Codex מכלי לכתיבת קוד לסביבת עבודה הכוללת הפעלת אפליקציות צד שלישי במחשב.
  • סוכני ה-AI מסוגלים לפעול ברקע על מערכת ההפעלה במקביל לעבודת המשתמש מבלי להפריע לו.
  • האפליקציה כוללת כעת דפדפן מובנה המאפשר בחירת אלמנטים ישירה, יחד עם יכולות זיכרון ואוטומציה ארוכת טווח.
  • העדכון זמין למשתמשי האפליקציה השולחנית, כאשר יכולת השליטה במחשב מוגבלת בשלב זה למערכת macOS.

חברת OpenAI הכריזה על עדכון משמעותי לאפליקציית שולחן העבודה Codex, אשר נועד להרחיב את יכולותיה מעבר לסיוע בכתיבת קוד ולהפוך אותה לכלי עבודה רחב יותר המלווה את תהליך הפיתוח כולו.

העדכון המרכזי מציג יכולת שליטה במחשב, המאפשרת לסוכני בינה מלאכותית להפעיל תוכנות, לנווט בדפדפן ולבצע משימות ארוכות טווח באופן עצמאי.

לדברי החברה, מטרת העדכון היא לאפשר למפתחים ולמשתמשים להאיץ את תהליכי העבודה שלהם על ידי שילוב הסוכן ישירות בסביבת הפעילות היומיומית.

שליטה במחשב ודפדפן מובנה

התכונה המרכזית בעדכון היא יכולת השימוש במחשב. התוספת החדשה מאפשרת לסוכני ה-AI באפליקציה להשתמש בסמן העכבר ולהקליד כדי להפעיל תוכנות אחרות המותקנות במחשב.

על פי הודעת החברה, מספר סוכנים מסוגלים לפעול ברקע במקביל לעבודת המשתמש, תכונה שלטענתה מסייעת בבדיקת אפליקציות ובביצוע פעולות בממשקים שאינם מציעים גישת API.

בנוסף, אפליקציית Codex משלבת כעת דפדפן מובנה הכולל מערכת הערות ויזואלית. המשתמשים יכולים ללחוץ על אלמנטים ספציפיים בעמודי אינטרנט או באפליקציות רשת כדי לספק לסוכן הוראות ישירות לביצוע שינויים (כמו שינוי פונט או גבולות תצוגה), מבלי צורך לתאר את המיקום בטקסט ארוך.

אוטומציה, זיכרון ויצירת תמונות

הגרסה החדשה מציגה יכולות אוטומציה מורחבות המאפשרות לסוכן לתזמן עבודה עתידית ולעבוד על משימות שעשויות להימשך ימים או שבועות.

לדברי OpenAI, האפליקציה מסוגלת כעת לזכור הקשרים משיחות קודמות, כולל העדפות אישיות, ואף להציע מיוזמתה פעולות המשך בעת הפעלת התוכנה מחדש בהתבסס על פרויקטים פתוחים.

Codex משלבת כעת גם יכולות יצירת תמונות המבוססות על המודל gpt-image-1.5. התוספת מאפשרת יצירה של שרטוטים, עיצובים לתצוגה ותמונות קונספט ישירות מתוך סביבת העבודה, כאשר הסוכן מסוגל להיעזר בצילומי מסך כדי לאמת את התוצאות מול בקשת המשתמש.

כלי פיתוח ותמיכה בתוספים

עבור מפתחים, העדכון מציע תמיכה בטיפול בהערות קוד מ-GitHub, אפשרות להרצת מספר לשוניות טרמינל (Terminal) במקביל, וחיבור מרחוק לסביבות פיתוח באמצעות פרוטוקול SSH, אשר נמצא בשלב בטא מוקדם.

בנוסף, שולבה תמיכה בתצוגה מקדימה של קבצי PDF, גיליונות אלקטרוניים ומסמכים מתוך סרגל הצד של האפליקציה.

כדי להרחיב את יכולות המערכת, החברה הוסיפה למעלה מ-100 תוספים  וחיבורי MCP המאפשרים אינטגרציה מורחבת עם כלים מקצועיים כמו פלטפורמות ניהול המשימות של אטלסיאן (Atlassian), מערכות מיקרוסופט ו-GitLab.

זמינות ולוחות זמנים

העדכון לאפליקציית שולחן העבודה Codex זמין החל מהיום עבור משתמשים המחוברים עם חשבון ChatGPT קיים.

האפליקציה זמינה עבור משתמשי ווינדוס ומק. עם זאת, תכונת השליטה במחשב (Computer Use) זמינה בשלב הראשון למשתמשי macOS בלבד.

השוואת מפרטים