אנבידיה מציגה את Nemotron Nano 2 ומסד נתונים מתמטי חדש

אנבידיה (NVIDIA) הכריזה על Nemotron Nano 2, משפחת מודלים חדשה בתחום הבינה המלאכותית, המיועדת למשימות של חשיבה לוגית, פתרון בעיות מתמטיות וניתוח קוד.

לצד המודלים עצמם חושפת החברה גם את Nemotron-CC-Math, אחד ממסדי הנתונים המתמטיים הגדולים והאיכותיים שנבנו עד היום, הכולל מעל 133 מיליארד טוקנים.

המודלים החדשים – Nemotron Nano 2

משפחת Nemotron Nano 2 מבוססת על שילוב בין טכנולוגיית Transformer המוכרת לבין שכבות מסוג Mamba, מה שמאפשר יעילות גבוהה יותר בעיבוד טקסטים ארוכים במיוחד.

המודלים החדשים מציעים חלון הקשר (Context-Window) של עד 128K טוקנים – כלומר יכולת לנתח מסמכים, שיחות או קוד באורך עצום מבלי לאבד את הרצף.

לפי הדוחות הטכניים של החברה, המודל Nemotron-Nano-9B-v2 מציג ביצועים דומים ואף עדיפים על פני מודלים מובילים אחרים בעלי גודל דומה, כמו Qwen3-8B של עליבאבא, אך במהירות גבוהה עד פי 6. הדבר מתאפשר בזכות שילוב בין אדריכלות יעילה, שלבי אימון מדויקים ושיטות דחיסה מתקדמות.

המודל החדש של אנבידיה משלב בין חומרה, תוכנה ומסדי נתונים כדי להציע אלטרנטיבה יעילה למודלים פתוחים קיימים.

התמיכה ברב-לשוניות והיכולת לעבד הקשרים ארוכים במיוחד הופכת את Nemotron Nano 2 לפתרון מתאים גם לעולם האקדמי וגם לתעשייה.

השוואת ביצועים של מודלי Nano 2 (תמונה: Nvidia) — השוואת ביצועים של מודלי Nano v2 (תמונה: Nvidia)

היכולות בפועל

המודלים מיועדים למשימות מורכבות של חשיבה והסקת מסקנות:

פתרון בעיות מתמטיות – יכולת להתמודד עם משוואות מורכבות, תרגילים אקדמיים וסטנדרטים כמו MATH.
כתיבה וניתוח קוד – המודלים אומנו על מאגר עצום של קוד בשפות שונות, כולל שאלות ותשובות סינתטיות שמדמות סיטואציות אמיתיות של תכנות.
יכולות רב-לשוניות – התמיכה כוללת נתונים מתורגמים ל-15 שפות, מה שמאפשר להשתמש במודלים גם בהקשרים גלובליים.
עיבוד טקסטים ארוכים – ניתוח מסמכים ארוכים במיוחד, תכונה חשובה למחקר, למידת מכונה והפקת מסקנות ממידע רחב.

Nemotron-CC-Math – מסד נתונים מתמטי חדש

לצד המודלים חושפת אנבידיה את Nemotron-CC-Math, מאגר נתונים עצום של תוכן מתמטי שהורכב מ-Common Crawl, עבר ניקוי, תקנון לפורמט LaTeX ושימור קוד ומשוואות כפי שמופיעים במקור.

בניגוד למאגרים קודמים שאיבדו חלק מהפורמט המתמטי, הפתרון של אנבידיה מצליח לשמר את הדיוק הנדרש.

המאגר כולל:

133 מיליארד טוקנים של תוכן מתמטי איכותי.
תת-קבוצה מצומצמת ואיכותית במיוחד של 52 מיליארד טוקנים.
שיפור ביצועים ניכר בבדיקות: עלייה של 4.8 עד 12.6 נקודות במדד MATH, ועלייה של 4.6 עד 14.3 נקודות בביצועי קוד (+MBPP).

דוגמה לעיבוד מידע עם Nemotron (תמונה: Nvidia)

זמינות

המודלים החדשים זמינים כבר כעת דרך פלטפורמת Hugging Face, יחד עם מסדי הנתונים לשימוש הקהילה.

אנבידיה מציינת כי מדובר בצעד נוסף בפתיחת המחקר בתחום הבינה המלאכותית, תוך שחרור של כלים ונתונים בקנה מידה גדול לשימוש ציבורי.

אנבידיה מאפשרת “לשחק” עם המודל באתר ייעודי – לחצו כאן

אנבידיה חושפת את Nemotron Nano 2 – מודלי AI לוגיים עם ביצועים משופרים ומסד נתונים מתמטי חדש

המודלים החדשים – Nemotron Nano 2

היכולות בפועל

Nemotron-CC-Math – מסד נתונים מתמטי חדש

זמינות

גאדג’טי מסקר: ASUS ROG Zephyrus Duo 2026 - מפלצת עם 2 מסכי OLED

גאדג’טי מסקר: ASUS Zenbook A14 2026 - נייד Snapdragon X2 Elite עם 33 שעות סוללה

Apple iPhone 16 Pro

Apple iPhone 16 Pro Max

Google Pixel 8 Pro

Apple iPhone 15 Pro Max

אנבידיה חושפת את Nemotron Nano 2 – מודלי AI לוגיים עם ביצועים משופרים ומסד נתונים מתמטי חדש

המודלים החדשים – Nemotron Nano 2

היכולות בפועל

Nemotron-CC-Math – מסד נתונים מתמטי חדש

זמינות

עוקבים? כל החדשות מגאדג'טי >>

גאדג’טי מסקר: ASUS ROG Zephyrus Duo 2026 - מפלצת עם 2 מסכי OLED

גאדג’טי מסקר: ASUS Zenbook A14 2026 - נייד Snapdragon X2 Elite עם 33 שעות סוללה

Apple iPhone 16 Pro

Apple iPhone 16 Pro Max

Google Pixel 8 Pro

Apple iPhone 15 Pro Max