אנתרופיק משיקה את Claude Sonnet 4.5 – מודל הקוד המתקדם ביותר שלה

Claude Sonnet 4.5 (מקור Anthropic) Claude Sonnet 4.5 (מקור Anthropic)

אנתרופיק (Anthropic) הכריזה על Claude Sonnet 4.5, מודל השפה הגדול (LLM) החדש של החברה המציג שיפור משמעותי ביכולות תכנות, שימוש במחשב והסקה לוגית.

המודל החדש משיג תוצאות מובילות במגוון מדדי ביצועים ומהווה את המודל המתקדם ביותר של אנתרופיק עד כה.

מודל ה-Claude Sonnet 4.5 מגיע כשדרוג למודל ה-Claude Sonnet 4 שהוצג מוקדם יותר השנה, כאשר הוא מציב רף חדש ביכולות תכנות ופיתוח תוכנה.

המודל החדש משיג את הציון הגבוה ביותר במדד SWE-bench Verified, המודד יכולות תכנות בעולם האמיתי, כאשר החברה מדווחת כי המודל מסוגל לשמור על ריכוז ולבצע משימות מורכבות ורב-שלביות במשך יותר מ-30 שעות רצופות, יכולת שהופכת אותו למתאים במיוחד לפרויקטי פיתוח ארוכי טווח.

שיפור משמעותי בביצועים

המודל מציג קפיצת מדרגה ביכולות שימוש במחשב. במדד OSWorld, המודד ביצועי מודלי AI במשימות מחשב אמיתיות, Claude Sonnet 4.5 משיג 61.4% – שיפור משמעותי לעומת 42.2% שהשיג Claude Sonnet 4 לפני ארבעה חודשים בלבד.

היכולות המשופרות מאפשרות למודל לנווט באתרים, למלא גיליונות אלקטרוניים ולהשלים משימות מורכבות ישירות בדפדפן.

בנוסף לשיפורים בתכנות, Claude Sonnet 4.5 מציג ביצועים משופרים במגוון רחב של תחומים, כולל הסקה לוגית ומתמטיקה.

מומחים בתחומי הפיננסים, המשפטים, הרפואה ומדעים מדויקים מדווחים על שיפור דרמטי בידע ספציפי לתחום וביכולות הסקה בהשוואה למודלים קודמים, כולל Opus 4.1.

מבחני ביצועים Claude Sonnet 4.5 (מקור Anthropic)
מבחני ביצועים Claude Sonnet 4.5 (מקור Anthropic)

שיפורים ב-Alignment והתנהגות המודל

אנתרופיק מדגישה כי Claude Sonnet 4.5 הוא המודל ה”מיושר” ביותר שהחברה פיתחה עד כה.

המודל מציג הפחתה משמעותית בהתנהגויות בעייתיות כמו נטייה להסכמה מוגזמת, הטעיה, חיפוש בכוח ונטייה לעודד מחשבות שווא.

החברה השקיעה מאמץ רב גם בהגנה מפני התקפות Prompt Injection (“הזרקת פרומפטים”), אחד הסיכונים המשמעותיים ביותר ליכולות אגנטיות ושימוש במחשב בעבור מודלי AI.

Imagine with Claude – יצירה בזמן אמת

במקביל להשקת Claude Sonnet 4.5, אנתרופיק השיקה ניסוי מחקר זמני בשם Imagine with Claude, המדגים את יכולות המודל החדש בצורה ייחודית.

בניסוי זה, Claude יוצר תוכנה בזמן אמת ללא קוד כתוב מראש או פונקציונליות מוגדרת מראש – כל מה שהמשתמש רואה הוא Claude יוצר ומגיב לבקשות בזמן אמת.

הניסוי מהווה הדגמה מרשימה ליכולות המודל החדש ומציג מה אפשר להשיג כאשר משלבים מודל מתקדם עם התשתית הנכונה.

Imagine with Claude זמין למנויי Max לחמישה ימים בלבד באתר claude.ai/imagine, ומעודד משתמשים לחקור את גבולות היכולות של המודל החדש בצורה אינטראקטיבית ומעניינת.

מודל ה-Claude Sonnet 4.5 זמין כבר היום לכל המשתמשים, והחברה ממליצה לשדרג אליו לכל השימושים. המודל מהווה תחליף ישיר למודלים קודמים ומספק ביצועים משופרים משמעותית.

השוואת מפרטים