אנבידיה (NVIDIA) הכריזה על Nemotron Nano 2, משפחת מודלים חדשה בתחום הבינה המלאכותית, המיועדת למשימות של חשיבה לוגית, פתרון בעיות מתמטיות וניתוח קוד.
לצד המודלים עצמם חושפת החברה גם את Nemotron-CC-Math, אחד ממסדי הנתונים המתמטיים הגדולים והאיכותיים שנבנו עד היום, הכולל מעל 133 מיליארד טוקנים.
המודלים החדשים – Nemotron Nano 2
משפחת Nemotron Nano 2 מבוססת על שילוב בין טכנולוגיית Transformer המוכרת לבין שכבות מסוג Mamba, מה שמאפשר יעילות גבוהה יותר בעיבוד טקסטים ארוכים במיוחד.
המודלים החדשים מציעים חלון הקשר (Context-Window) של עד 128K טוקנים – כלומר יכולת לנתח מסמכים, שיחות או קוד באורך עצום מבלי לאבד את הרצף.
לפי הדוחות הטכניים של החברה, המודל Nemotron-Nano-9B-v2 מציג ביצועים דומים ואף עדיפים על פני מודלים מובילים אחרים בעלי גודל דומה, כמו Qwen3-8B של עליבאבא, אך במהירות גבוהה עד פי 6. הדבר מתאפשר בזכות שילוב בין אדריכלות יעילה, שלבי אימון מדויקים ושיטות דחיסה מתקדמות.
המודל החדש של אנבידיה משלב בין חומרה, תוכנה ומסדי נתונים כדי להציע אלטרנטיבה יעילה למודלים פתוחים קיימים.
התמיכה ברב-לשוניות והיכולת לעבד הקשרים ארוכים במיוחד הופכת את Nemotron Nano 2 לפתרון מתאים גם לעולם האקדמי וגם לתעשייה.

היכולות בפועל
המודלים מיועדים למשימות מורכבות של חשיבה והסקת מסקנות:
- פתרון בעיות מתמטיות – יכולת להתמודד עם משוואות מורכבות, תרגילים אקדמיים וסטנדרטים כמו MATH.
- כתיבה וניתוח קוד – המודלים אומנו על מאגר עצום של קוד בשפות שונות, כולל שאלות ותשובות סינתטיות שמדמות סיטואציות אמיתיות של תכנות.
- יכולות רב-לשוניות – התמיכה כוללת נתונים מתורגמים ל-15 שפות, מה שמאפשר להשתמש במודלים גם בהקשרים גלובליים.
- עיבוד טקסטים ארוכים – ניתוח מסמכים ארוכים במיוחד, תכונה חשובה למחקר, למידת מכונה והפקת מסקנות ממידע רחב.
Nemotron-CC-Math – מסד נתונים מתמטי חדש
לצד המודלים חושפת אנבידיה את Nemotron-CC-Math, מאגר נתונים עצום של תוכן מתמטי שהורכב מ-Common Crawl, עבר ניקוי, תקנון לפורמט LaTeX ושימור קוד ומשוואות כפי שמופיעים במקור.
בניגוד למאגרים קודמים שאיבדו חלק מהפורמט המתמטי, הפתרון של אנבידיה מצליח לשמר את הדיוק הנדרש.
המאגר כולל:
- 133 מיליארד טוקנים של תוכן מתמטי איכותי.
- תת-קבוצה מצומצמת ואיכותית במיוחד של 52 מיליארד טוקנים.
- שיפור ביצועים ניכר בבדיקות: עלייה של 4.8 עד 12.6 נקודות במדד MATH, ועלייה של 4.6 עד 14.3 נקודות בביצועי קוד (+MBPP).

זמינות
המודלים החדשים זמינים כבר כעת דרך פלטפורמת Hugging Face, יחד עם מסדי הנתונים לשימוש הקהילה.
אנבידיה מציינת כי מדובר בצעד נוסף בפתיחת המחקר בתחום הבינה המלאכותית, תוך שחרור של כלים ונתונים בקנה מידה גדול לשימוש ציבורי.
אנבידיה מאפשרת “לשחק” עם המודל באתר ייעודי – לחצו כאן