⭐ נקודות עיקריות
- עליבאבא השיקה את סדרת Qwen 3.5 הכוללת מודל פתוח ומודל מנוהל לענן.
- המודל מציג ארכיטקטורה היברידית עם 397 מיליארד פרמטרים, מתוכם רק 17 מיליארד פעילים.
- יכולות “סוכן” (Agentic) מתקדמות מאפשרות שליטה עצמאית במחשבים ובמכשירים ניידים.
- החברה מדווחת על ביצועים העוקפים את GPT-5.2 ו-Claude 4.5 במבחני השוואה.
צוות הפיתוח של Qwen ב-Alibaba Cloud, זרוע הענן של קבוצת עליבאבא (Alibaba) הסינית, הכריז על Qwen 3.5, הגרסה החדשה והמתקדמת ביותר של מודל Qwen, שנועד להתחרות במודלי ה-AI המערביים כמו Gemini ו-ChatGPT, עם דגש על יכולות “סוכן” (Agentic AI) וארכיטקטורה יעילה המאפשרת ביצועים גבוהים בעלות מופחתת.
הסדרה החדשה כוללת את מודל הדגל הפתוח Qwen3.5-397B-A17B, ואת המודל המנוהל Qwen3.5-Plus, אשר זמין דרך שירותי הענן של החברה.
המודלים החדשים תוכננו לבצע מטלות מורכבות באופן עצמאי, תוך שילוב הבנה חזותית וטקסטואלית ברמה טבעית (Native Multimodal).
מאפיינים עיקריים
החידוש המרכזי ב-Qwen 3.5 טמון בארכיטקטורה ההיברידית שלו. המודל כולל 397 מיליארד פרמטרים, אך משתמש בטכנולוגיית Mixture of Experts (או בקיצור MoE) בשילוב עם מנגנון קשב ליניארי (Linear Attention), שילוב המאפשר למודל להפעיל רק 17 מיליארד פרמטרים בכל פעולת הסקה (Inference).
גישה זו מאפשרת למודל להציג יכולות של מודלים גדולים משמעותית, תוך שמירה על מהירות תגובה ועלויות הפעלה נמוכות.
לדברי החברה, המודל החדש זול ב-60% לשימוש ומהיר פי 8 בעיבוד עומסי עבודה גדולים בהשוואה לקודמו.
בנוסף, המודל מוגדר כ-Native Vision-Language Model, כלומר הוא אומן מראש להבין ולעבד טקסט, תמונות ווידאו כמקשה אחת, ולא כשכבות נפרדות.
יכולת זו מהווה בסיס למה שהחברה מכנה “Visual Agentic Capabilities” – היכולת של המודל לשמש כסוכן המבצע פעולות אקטיביות בממשקי מחשב ומובייל, כמו גלישה באינטרנט, שימוש באפליקציות וכתיבת קוד.
ביצועים
על פי הנתונים שפרסמה עליבאבא, מודל ה-Qwen 3.5 מציג ביצועים תחרותיים ואף עדיפים על פני המודלים המובילים בשוק כיום.
בטבלאות ההשוואה שהציגה החברה, המודל גובר על GPT-5.2, Claude 4.5 Opus ו-Gemini 3 Pro במגוון מבחנים סינתטיים.
במבחן הידע הכללי MMLU-Pro, השיג המודל ציון של 87.8, ובמבחן הקידוד LiveCodeBench v6 הציג תוצאות הדומות למתחרים.
בתחום הראייה הממוחשבת וההבנה המרחבית, החברה מדגימה כיצד המודל מסוגל לנתח סרטוני וידאו, לזהות אובייקטים במרחב תלת-ממדי ולפתור חידות ויזואליות מורכבות.

סוכן ויזואלי ושליטה בממשקים
מעבר ליכולת לנתח תמונות סטטיות, Qwen 3.5 מציג יכולות של “סוכן ויזואלי” (Visual Agent). החברה מציינת כי המודל מסוגל לשלוט בממשקי משתמש של מחשבים וסמארטפונים.
המודל יכול לבצע רצף פעולות עצמאי כמו ניווט בין אפליקציות, לחיצה על כפתורים והקלדת טקסט על בסיס הנחיות בשפה טבעית.
בנוסף, חלון ההקשר הגדול מאפשר למודל “לצפות” ולנתח סרטוני וידאו באורך של עד שעתיים, להבין את ההתרחשות בהם ואף להמיר סקיצות ידניות של ממשקי משתמש ישירות לקוד HTML פעיל.
פיתוח ו-Vibe Coding
בגזרת הפיתוח, המודל תומך ב”וייב קודינג” (Vibe Coding) עם תמיכה טבעית בקריאה לפונקציות (Function Calling) ומשתלב עם סביבות פיתוח צד-שלישי פופולריות.
החברה הכריזה על תמיכה רשמית בכלים כמו OpenClaw, Cline ו-Qwen Code, המאפשרים למתכנתים לבנות יישומים, אתרי אינטרנט וסקריפטים מורכבים באמצעות הנחיות טקסטואליות, כאשר המודל מריץ את הקוד, מתקן שגיאות ומעדכן את הפרויקט בזמן אמת.
זמינות
מודל ה-Qwen3.5-397B-A17B זמין להורדה מ-Hugging Face ו-GitHub, בעוד שגרסת ה-Qwen3.5-Plus זמינה לשימוש דרך פלטפורמת Alibaba Cloud Model Studio.