מיסטרל משיקה את Mistral OCR 3: מודל זיהוי כתב מתקדם לארגונים

Mistral OCR 3 (מקור Mistral AI) Mistral OCR 3 (מקור Mistral AI)

⭐ נקודות עיקריות

  • Mistral OCR 3 מיועד לפענוח מסמכים מורכבים כולל כתב יד, טפסים וטבלאות צפופות.
  • המודל משמר את מבנה המסמך ומספק פלט מובנה ב-Markdown וב-HTML.
  • שיפור ביצועים משמעותי לעומת OCR 2 עם שיעור הצלחה של 74% בתרחישים עסקיים.
  • זמין מיידית דרך ה-API ו-Mistral AI Studio במחיר תחרותי.

חברת הבינה המלאכותית מיסטרל (Mistral AI) הכריזה על Mistral OCR 3, הדור החדש של מודל זיהוי התווים האופטי (OCR) מתוצרתה.

המודל החדש מיועד לפתור את אחד האתגרים המרכזיים באימוץ בינה מלאכותית בארגונים: המרת ארכיונים פיזיים ומסמכים סרוקים למידע דיגיטלי נגיש, המאפשר למודלי שפה גדולים (LLMs) ולסוכני AI לבצע עליהם עיבוד וניתוח.

בחברה מדגישים כי המודל תוכנן להתמודד עם תרחישי קצה מורכבים כמו כתב יד, מסמכים פגומים וטבלאות מרובות נתונים.

מאפיינים עיקריים וחדשנות

ה-Mistral OCR 3 מציג שיפור משמעותי ביכולת הפענוח של מסמכים שאינם סטנדרטיים.

על פי החברה, המודל מסוגל לזהות ולפענח כתב יד מחובר (Cursive), הערות שנכתבו על גבי טפסים מודפסים וטקסט מעורב – משימות שנחשבו באופן מסורתי למכשול עבור מערכות OCR קלאסיות.

בנוסף, המודל כולל יכולות מתקדמות לשחזור מבנה המסמך. הוא אינו מסתפק בחילוץ הטקסט בלבד, אלא יודע לזהות מבני טבלאות מורכבים, כולל תאים מאוחדים, כותרות והיררכיות של עמודות.

הפלט המתקבל כולל תגיות HTML המשמרות את עיצוב הטבלה המקורי, מה שמאפשר למערכות המשך להבין לא רק את התוכן אלא גם את ההקשר המבני שלו.

החברה מציינת כי המודל עמיד בפני “רעשים” ויזואליים נפוצים כמו סריקות ברזולוציה נמוכה, עיוותים וארטיפקטים של דחיסת תמונה.

ביצועים

מיסטרל מדווחת כי המודל החדש מציג קפיצת מדרגה לעומת הדור הקודם (OCR 2), עם שיעור הצלחה של 74% במבחני השוואה הכוללים טפסים, מסמכים סרוקים ותוכן בכתב יד.

לטענת החברה, המודל עולה בביצועיו הן על פתרונות עיבוד מסמכים ארגוניים מסורתיים והן על פתרונות OCR מבוססי AI אחרים הקיימים בשוק.

בדיקות הביצועים של החברה התבססו על מדדי התאמה (Fuzzy-match) מול נתוני אמת (Ground truth) שנאספו מתרחישי שימוש עסקיים אמיתיים.

מבחני ביצועים Mistral OCR 3 (מקור Mistral AI)
מבחני ביצועים Mistral OCR 3 (מקור Mistral AI)

יכולות נוספות ושימושים

המודל משולב באופן מלא ב-Document AI, רכיב בתוך פלטפורמת Mistral AI Studio, המאפשר למפתחים ולמשתמשים עסקיים להעלות קובצי PDF או תמונות ולקבל פלט טקסט נקי או בפורמט JSON מובנה.

יכולת זו מיועדת לייעל תהליכי עבודה בתעשיות עתירות ניירת כמו פיננסים, ביטוח ובריאות, שם נדרש עיבוד של חשבוניות, דוחות רפואיים ועוד.

המודל תומך בנוסף בפלט בפורמט Markdown (“מרקדאון”) המועשר ב-HTML, מה שהופך אותו לאידיאלי להזנת נתונים למערכות RAG (ר”ת Retrieval-Augmented Generation) ולסוכנים חכמים הזקוקים להקשר מבני.

כמו כן, הטכנולוגיה מאפשרת הנגשה של מסמכים עבור קוראי מסך וטכנולוגיות מסייעות.

זמינות ומחירים

ה-Mistral OCR 3 זמין החל מהיום לשימוש באמצעות ה-API של החברה ודרך פלטפורמת ה-Mistral AI Studio.

העלות עומדת על 2 דולר לכל 1,000 עמודים, כאשר שימוש ב-API לעיבוד באצוות (Batch Processing) מוריד את המחיר ב-50% לדולר אחד לכל 1,000 עמודים.

השוואת מפרטים