מודל Claude Sonnet 4.6 הושק עם שדרוג גדול לקוד ולסוכני AI

⭐ נקודות עיקריות

אנתרופיק משיקה את Claude Sonnet 4.6 כמודל ברירת המחדל החדש למשתמשים החינמיים ולמנויי Pro.
המודל מציע שיפור בולט ביכולות עם ציון 72.5% במבחן OSWorld המדמה עבודה אמיתית מול מחשב.
המודל מציג שדרוג בכתיבת קוד ובתכנון סוכנים, עם העדפה של מפתחים על פני הדור הקודם.
חלון הקשר של מיליון טוקנים בבטא מאפשר עיבוד מסמכים ארוכים ופרויקטים רחבי היקף בבקשה אחת.

אנתרופיק (Anthropic) הכריזה על Claude Sonnet 4.6, מודל השפה החדש של החברה המחליף את Sonnet 4.5 כברירת המחדל בעבור המשתמשים החינמיים ב-Claude ומנויי ה-Pro, כאשר הוא מביא עמו שדרוג מקיף ביכולות הליבה הכוללות כתיבת קוד, שימוש במחשב (Computer Use), חשיבה ארוכת טווח ותכנון סוכנים (Agentic Planning).

לדברי החברה, המודל החדש מציג ביצועים שבעבר דרשו שימוש במודלים מסוג Opus, אך בעלות נמוכה יותר ועם מהירות גבוהה יותר.

בנוסף לשיפורים בביצועים, אנתרופיק מציגה בגרסת בטא חלון הקשר (Context Window) רחב במיוחד של מיליון טוקנים, המאפשר למודל “לזכור” ולעבד כמויות מידע עצומות בבקשה אחת.

הכירו את Claude Sonnet 4.6

החידוש המרכזי ב-Sonnet 4.6 הוא קפיצת המדרגה ביכולות ה-Computer Use. מדובר ביכולת של המודל לתפעל מחשב באופן הדומה למשתמש אנושי – באמצעות הזזת סמן העכבר, הקלדה על מקלדת וירטואלית וניווט בממשקים גרפיים של תוכנות רגילות כמו דפדפני אינטרנט ועורכי קוד, ללא צורך להשתמש ב-API ייעודי.

במבחן הביצועים OSWorld, המדמה מאות משימות בתוכנות אמיתיות, השיג Sonnet 4.6 ציון של 72.5%, זאת לעומת 61.4% שהשיג Sonnet 4.5 ו-14.9% בלבד בגרסה קודמת מאוקטובר 2024.

החברה מציינת כי המודל מסוגל כעת לבצע משימות מורכבות כמו ניווט בגיליונות אלקטרוניים ומילוי טפסים מרובי שלבים תוך שימוש במספר לשוניות דפדפן.

ביצועים

בבחינת יכולות התכנות, נתונים מוקדמים של החברה מראים כי מפתחים העדיפו את השימוש ב-Sonnet 4.6 על פני Sonnet 4.5 בשיעור של כ-70%.

המשתמשים דיווחו על יכולת טובה יותר של המודל לקרוא את ההקשר לפני ביצוע שינויים בקוד, ועל נטייה לאחד לוגיקה משותפת במקום ליצור כפילויות.

נתון מעניין נוסף מגיע ממבחן Vending-Bench Arena, המדמה ניהול עסק לאורך זמן. המודל החדש הציג אסטרטגיה של השקעה מסיבית בקיבולת בשלבים הראשונים (תוך הפסד כספי זמני), ומעבר חד לרווחיות בשלבים הסופיים – אסטרטגיה שהובילה אותו לניצחון על פני מודלים מתחרים.

בהשוואה למתחרים בשוק, טבלאות הביצועים שמציגה אנתרופיק מראות כי Sonnet 4.6 עוקף את Gemini 3 Pro ואת GPT-5.2 במבחנים כמו SWE-bench Verified (פתרון בעיות קוד) עם ציון של 59.1%, ובמבחני סוכנים אוטונומיים.

עם זאת, הוא עדיין מפגר מעט אחרי מודל ה-Opus 4.6 שהושק מוקדם יותר החודש במשימות חשיבה עמוקה במיוחד.

מבחני ביצועים Sonnet 4.6 (מקור Anthropic)

יכולות נוספות

המודל החדש מציג יכולות משופרות גם בתחום העיצוב והחזותיות. משתמשים מוקדמים דיווחו כי הפלטים הוויזואליים, כגון פריסות (Layouts) ואנימציות, הם מלוטשים יותר ובעלי רגישות עיצובית גבוהה יותר בהשוואה לדגמים קודמים.

עבור משתמשים עסקיים, אנת’רופיק מרחיבה את התמיכה בתוסף Claude for Excel. התוסף תומך כעת בחיבורי MCP, המאפשרים למודל לשאוב מידע בזמן אמת ממקורות חיצוניים ומערכות פיננסיות ישירות לתוך הגיליון האלקטרוני, מבלי לצאת מהתוכנה.

זמינות

מודל ה-Claude Sonnet 4.6 זמין בכל הפלטפורמות של החברה, כולל ממשק האינטרנט Claude.ai, אפליקציית Claude Code וה-API למפתחים.

המודל זמין כברירת מחדל גם בעבור משתמשים חינמיים, כאשר הגישה כוללת כעת גם יכולות יצירת קבצים ושימוש ב”מחברים” (Connectors).

אנתרופיק משיקה את Claude Sonnet 4.6 עם שדרוג גדול לקוד ולסוכני AI

הכירו את Claude Sonnet 4.6

ביצועים

יכולות נוספות

זמינות

גאדג’טי מסקר: ASUS ROG Zephyrus Duo 2026 - מפלצת עם 2 מסכי OLED

גאדג’טי מסקר: ASUS Zenbook A14 2026 - נייד Snapdragon X2 Elite עם 33 שעות סוללה

Apple iPhone 16 Pro

Apple iPhone 16 Pro Max

Google Pixel 8 Pro

Apple iPhone 15 Pro Max

אנתרופיק משיקה את Claude Sonnet 4.6 עם שדרוג גדול לקוד ולסוכני AI

הכירו את Claude Sonnet 4.6

ביצועים

יכולות נוספות

זמינות

עוקבים? כל החדשות מגאדג'טי >>

גאדג’טי מסקר: ASUS ROG Zephyrus Duo 2026 - מפלצת עם 2 מסכי OLED

גאדג’טי מסקר: ASUS Zenbook A14 2026 - נייד Snapdragon X2 Elite עם 33 שעות סוללה

Apple iPhone 16 Pro

Apple iPhone 16 Pro Max

Google Pixel 8 Pro

Apple iPhone 15 Pro Max