הוכרז: GPT-5.4 של OpenAI - מודל חדש לעבודה מקצועית וסוכני AI

⭐ נקודות עיקריות

OpenAI מציגה את GPT-5.4 – מודל שפה חדש המתמקד בעבודה מקצועית, כתיבת קוד וסוכני AI.
המודל משלב את יכולות כתיבת הקוד של GPT-5.3-Codex יחד עם שיפורים בהסקה, חיפוש מידע ושימוש בכלים.
תמיכה בהקשר של עד מיליון טוקנים מאפשרת עבודה על משימות מורכבות וארוכות טווח.
שיפור משמעותי בדיוק ובאמינות: ירידה של 33% בטענות שגויות לעומת GPT-5.2.

חברת OpenAI הכריזה הערב (ה’, 5.3) על GPT-5.4, מודל שפה חדש המיועד במיוחד לעבודה מקצועית, פיתוח תוכנה ושימוש בסוכני בינה מלאכותית (AI Agents).

המודל זמין החל מהיום דרך ChatGPT, ממשק ה-API למפתחים וסביבת הפיתוח Codex, כאשר גרסה נוספת בשם GPT-5.4 Pro מיועדת למשתמשים הזקוקים לביצועים מקסימליים במשימות מורכבות.

GPT-5.4 מאחד תחת מודל אחד את ההתקדמות האחרונה של החברה בתחומי ההסקה (Reasoning), כתיבת הקוד והפעלת סוכנים אוטונומיים.

לפי OpenAI, מדובר במודל היעיל והחזק ביותר שהחברה הציגה עד כה עבור משימות מקצועיות בעולם האמיתי.

מודל לעבודה מקצועית

GPT-5.4 נועד להתמודד עם משימות מורכבות המאפיינות סביבת עבודה מודרנית – החל מיצירת מצגות וגיליונות נתונים, דרך ניתוח מסמכים ועד כתיבת קוד והפעלת תהליכים אוטומטיים.

במבחן GDPval, הבוחן את יכולות המודלים לבצע משימות ידע מקצועיות ב-44 מקצועות שונים, המודל הצליח להגיע לשיעור של 83% תוצאות השוות או טובות יותר מאלו של אנשי מקצוע אנושיים. לשם השוואה, GPT-5.2 הגיע לציון של 70.9% בלבד.

השיפור מורגש במיוחד במשימות משרדיות נפוצות. במבחן פנימי של OpenAI המדמה עבודת אנליסט בנקאות השקעות, GPT-5.4 השיג ציון ממוצע של 87.3% ביצירת מודלים פיננסיים בגיליונות נתונים, לעומת 68.4% בלבד בדור הקודם.

בנוסף, במבחני הערכה של מצגות, בוחנים אנושיים העדיפו את המצגות שיצר GPT-5.4 בכ-68% מהמקרים בזכות עיצוב חזותי משופר ושימוש טוב יותר בתמונות וגרפיקה.

שילוב יכולות הקוד של GPT-5.3-Codex

אחד השינויים המרכזיים במודל החדש הוא שילוב יכולות הקוד המתקדמות של GPT-5.3-Codex בתוך המודל הראשי. באופן זה הופך GPT-5.4 למודל אחיד המשלב יכולות כתיבת קוד מתקדמות לצד ביצועים גבוהים במשימות ידע.

במבחן הקוד הציבורי SWE-Bench Pro, המודד את יכולת המודל לפתור בעיות אמיתיות בפרויקטי תוכנה, GPT-5.4 הגיע לציון של 57.7%, מעט מעל GPT-5.3-Codex (56.8%) ולפני GPT-5.2 (55.6%).

לדברי החברה, המודל מצטיין במיוחד במשימות פיתוח Frontend מורכבות, בהן הוא מצליח ליצור תוצאות פונקציונליות ואסתטיות יותר בהשוואה למודלים קודמים.

בנוסף, ב-Codex ניתן להפעיל מצב /fast המאפשר מהירות יצירת טוקנים גבוהה בכ-1.5 פעמים, מה שמאפשר למפתחים לבצע איטרציות קוד מהירות יותר בזמן העבודה.

סוכני AI שמסוגלים להפעיל מחשב

אחד החידושים המשמעותיים ב-GPT-5.4 הוא שילוב יכולות Computer Use מובנות. מדובר במודל הראשון של OpenAI המאפשר לסוכני AI להפעיל מחשב באופן ישיר.

המודל מסוגל:

להבין צילומי מסך של ממשקי תוכנה.
לבצע פעולות באמצעות מקלדת ועכבר.
להפעיל תוכנות ואתרי אינטרנט.
לבצע משימות מורכבות לאורך זמן.

במבחן OSWorld-Verified, הבוחן יכולת עבודה בסביבת מחשב מלאה, הגיע GPT-5.4 לשיעור הצלחה של 75% – נתון הגבוה אף מהביצועים האנושיים שנמדדו במבחן (72.4%).

יכולות אלו מאפשרות לבנות סוכני AI המסוגלים לבצע תהליכים שלמים, למשל קריאת מיילים, הורדת קבצים, עיבודם והזנת הנתונים למערכת אחרת.

חלון הקשר של עד מיליון טוקנים

GPT-5.4 תומך בהקשר (Context Window) של עד 1 מיליון טוקנים בסביבת Codex וה-API.

המשמעות היא שהמודל יכול לעבוד על מסמכים ארוכים במיוחד, פרויקטים גדולים או שרשראות משימות מורכבות לאורך זמן.

יכולת זו מאפשרת לסוכנים לתכנן, לבצע ולבדוק משימות ארוכות טווח תוך שמירה על ההקשר המלא של העבודה.

פחות טעויות ויותר אמינות

OpenAI מציינת כי GPT-5.4 הוא המודל העובדתי ביותר שהחברה פיתחה עד כה.

בבדיקות פנימיות שנעשו על שאלות בהן משתמשים סימנו טעויות עובדתיות, נמצא כי:

הטענות הבודדות של המודל היו 33% פחות שגויות לעומת GPT-5.2.
תגובות שלמות היו 18% פחות מועדות להכיל שגיאות.

החברה מדגישה כי שיפור זה נועד להפוך את המודל לכלי אמין יותר לשימוש מקצועי בתחומים כמו פיננסים, משפטים וניתוח מידע.

שיפור בשימוש בכלים ובחיפוש מידע

GPT-5.4 משפר גם את היכולת לעבוד עם כלים חיצוניים. אחד החידושים המרכזיים הוא Tool Search, מנגנון המאפשר למודל לחפש ולהשתמש בכלים רק כאשר הם נדרשים.

בגישה הישנה, כל ההגדרות של הכלים היו נטענות מראש בתוך הפרומפט, מה שהיה מוסיף לעיתים עשרות אלפי טוקנים לכל בקשה.

עם Tool Search, המודל מקבל רק רשימת כלים בסיסית ויכול לשלוף את ההגדרות המלאות של הכלי בזמן הצורך.

לפי OpenAI, שיטה זו הצליחה להפחית את השימוש בטוקנים בכ-47% במערכות הכוללות עשרות כלים.

חיסכון בטוקנים בשימוש בכלים (קרדיט: OpenAI)

בנוסף, המודל מציג שיפור משמעותי גם ביכולת חיפוש מידע באינטרנט. במבחן BrowseComp, הבוחן את יכולת המודל למצוא מידע קשה לאיתור ברשת, הגיע GPT-5.4 לציון של 82.7%, לעומת 65.8% בלבד בדור הקודם.

זמינות ומחירים

המודל החדש מתחיל להגיע בהדרגה החל מהיום:

ב-ChatGPT – המודל זמין למנויי Plus, Team ו-Pro תחת השם GPT-5.4 Thinking.
ב-API למפתחים – תחת השם gpt-5.4.
גרסת GPT-5.4 Pro זמינה למשתמשי Pro ו-Enterprise ולמפתחים הזקוקים לביצועים מקסימליים.

ב-ChatGPT מחליף המודל החדש את GPT-5.2 Thinking, אשר יישאר זמין כמודל Legacy למשך שלושה חודשים עד להסרתו ביוני 2026.

ב-API המחיר לטוקן גבוה מעט מהדור הקודם:

GPT-5.4 – כ-2.50 דולר למיליון טוקני קלט ו-15 דולר למיליון טוקני פלט.
GPT-5.4 Pro – כ-30 דולר למיליון טוקני קלט ו-180 דולר למיליון טוקני פלט.

עם זאת, OpenAI מציינת כי המודל יעיל יותר בשימוש בטוקנים, כך שבמקרים רבים העלות הכוללת של משימות עשויה דווקא לרדת.

צעד נוסף לעבר סוכני AI אוטונומיים

ההשקה של GPT-5.4 מסמנת צעד נוסף בהתפתחות מודלי הבינה המלאכותית לכיוון סוכנים אוטונומיים המסוגלים לבצע משימות מורכבות בעולם האמיתי.

השילוב בין יכולות כתיבת קוד מתקדמות, שימוש במחשב, חיפוש מידע ועבודה עם כלים חיצוניים מאפשר למודל לבצע תהליכים שלמים – ולא רק לספק תשובות לשאלות.

לדברי OpenAI, המטרה היא לאפשר למפתחים ולארגונים לבנות מערכות AI המסוגלות לבצע עבודה ממשית, החל מפיתוח תוכנה ועד ניתוח נתונים וניהול תהליכים עסקיים.

הוכרז: GPT-5.4 – מודל חדש לכתיבת קוד, עבודה מקצועית וסוכני AI

מודל לעבודה מקצועית

שילוב יכולות הקוד של GPT-5.3-Codex

סוכני AI שמסוגלים להפעיל מחשב

חלון הקשר של עד מיליון טוקנים

פחות טעויות ויותר אמינות

שיפור בשימוש בכלים ובחיפוש מידע

זמינות ומחירים

צעד נוסף לעבר סוכני AI אוטונומיים

גאדג’טי מסקר: ASUS ROG Zephyrus Duo 2026 - מפלצת עם 2 מסכי OLED

גאדג’טי מסקר: ASUS Zenbook A14 2026 - נייד Snapdragon X2 Elite עם 33 שעות סוללה

Apple iPhone 16 Pro

Apple iPhone 16 Pro Max

Google Pixel 8 Pro

Apple iPhone 15 Pro Max

הוכרז: GPT-5.4 – מודל חדש לכתיבת קוד, עבודה מקצועית וסוכני AI

מודל לעבודה מקצועית

שילוב יכולות הקוד של GPT-5.3-Codex

סוכני AI שמסוגלים להפעיל מחשב

חלון הקשר של עד מיליון טוקנים

פחות טעויות ויותר אמינות

שיפור בשימוש בכלים ובחיפוש מידע

זמינות ומחירים

צעד נוסף לעבר סוכני AI אוטונומיים

עוקבים? כל החדשות מגאדג'טי >>

גאדג’טי מסקר: ASUS ROG Zephyrus Duo 2026 - מפלצת עם 2 מסכי OLED

גאדג’טי מסקר: ASUS Zenbook A14 2026 - נייד Snapdragon X2 Elite עם 33 שעות סוללה

Apple iPhone 16 Pro

Apple iPhone 16 Pro Max

Google Pixel 8 Pro

Apple iPhone 15 Pro Max