הכירו את Kling O1: מודל מאוחד שמבין, יוצר ועורך וידאו ותמונות

Kling AI (מקור Kling AI)

חברת Kling AI הכריזה על Kling O1, המודל המולטימודלי המאוחד הראשון בתעשייה לדברי החברה המשלב יכולות יצירה, עריכה והבנה של תוכן ויזואלי בפלטפורמה אחת.

המודל, המבוסס על תפיסת Multi-modal Visual Language (MVL), מציע שני מצבי פעולה מרכזיים – VIDEO O1 ו-Image O1 – המאפשרים יצירה ועריכה של סרטונים ותמונות באמצעות שפה טבעית, תוך שמירה על עקביות גבוהה ושליטה מלאה על התוצאה הסופית.

בניגוד למודל ה-Kling VIDEO הרגיל של החברה הזמין כיום בגרסה 2.6 ליצירת וידאו, מודל ה-Kling O1 מבטל את הצורך במעבר בין מודלים שונים או כלים מרובים, ומאפשר זרימת עבודה חלקה מקצה לקצה – מהרעיון הראשוני ועד לשינויים הסופיים, הכל במקום אחד.

המודל החדש מאפשר למשתמשים לעבור מרעיון ליצירה, ומיצירה לשינויים, בצורה אינטואיטיבית ויעילה.

VIDEO O1 – שליטה יצירתית מלאה דרך קלט מולטימודלי

מצב ה-VIDEO O1 הוא הראשון בתחום יצירת הוידאו המשלב מגוון רחב של משימות למנוע אחד מאוחד.

המצב כולל 18 יכולות שונות: יצירת וידאו על בסיס ייחוס, טקסט לוידאו (text-to-video), יצירת וידאו על ידי השלמת פריימים של פתיחה וסיום (start & end frames, עריכת תוכן וידאו), שינויים, טרנספורמציות, בניית עיצוב מחדש (restyling) והרחבת מצלמה להשלמת הפרטים מעבר למה שתמונת הבסיס מציגה.

המודל מנצל הבנה סמנטית עמוקה, כאשר כל מה שמועלה – תמונה, וידאו, נושא או טקסט – מתפרש כפרומפט.

משתמשים יכולים להקליד פרומפטים כמו “הסר עוברי אורח”, “שנה יום לשקיעה” או “החלף את התלבושת של הדמות הראשית”, והמודל מבין את ההקשר הויזואלי ומבצע את המשימות במדויק – החל משינוי הנושא, הרקע, סגנון הוידאו, צבעי אובייקטים, מזג האוויר, המיקום והזמן בסרטון.

עקביות מרובת נושאים

VIDEO O1 מתמודד עם אתגר ארוך שנים בתעשייה – שמירה על עקביות של דמויות, אביזרים וסצנות.

המודל פועל כמו במאי אנושי, ומבטיח שככל שהמצלמה זזה או העלילה מתפתחת, האלמנטים הויזואליים נשארים עקביים, אפילו בסצנות קבוצתיות מורכבות.

המודל תומך בייחוס של עד 7 תמונות או אלמנטים, ומאפשר שילוב של דמויות, אביזרים וסצנות שונות.

VIDEO O1 תומך בשילוב משימות שונות בפרומפט אחד, כמו “הוספת נושא תוך שינוי הרקע” או “שינוי הסגנון תוך שימוש באלמנטים”.

המודל תומך ביצירת סרטונים באורך 3-10 שניות, ומעניק שליטה על קצב הסיפור והנרטיב.

במבחנים פנימיים, Video O1 השיג יחס ניצחון של 247% מול Google Veo 3.1 Fast במשימות Ingredients to Video, ו-230% מול Runway Aleph במשימות Instruction-transformation.

Image O1 – עריכת תמונות לפי רצון המשתמש

מצב ה-Image O1 כולל בסיס ידע חזק ויכולות חשיבה מולטימודלית. המודל מפרש את כוונת המשתמש בנאמנות גבוהה, ומסוגל לעבד עד 10 תמונות ייחוס כדי לסדר מחדש אלמנטים, להעביר סגנונות או לחלץ מאפיינים.

בהתבסס על יכולות משופרות של הקפדה על פרומפטים, המודל מאפשר עריכת תמונות במדויק. ללא כל ידע מקצועי מוקדם בעריכה, משתמשים יכולים להוסיף, להסיר או לשנות אובייקטים ודמויות בתמונה תוך שמירה על הסגנון המקורי, התאורה והמרקם.

ממשק Kling O1 (מקור Kling AI)
ממשק Kling O1 (מקור Kling AI)

המודל מתוכנן לזרימות עבודה מורכבות, כמו יצירת רינדרים תלת-ממדיים ריאליסטיים מסקיצות עיצוב פנים או התאמת תאורה על בסיס חיצים כיווניים.

באופן קריטי, הוא שומר על עקביות הנושא בתמונות שונות שנוצרו – תכונה חיונית לעיצוב דמויות IP ויצירת קומיקס.

במשימת multi-image reference, ה-Image O1 השיג יחס ניצחון של 174% מול Nano Banana ו-123% מול Dreamina Image 4.0, ממקם אותו בחזית התעשייה.

זמינות

מודל Kling O1 עם מצבי Video O1 ו-Image O1 זמין כעת לשימוש דרך פלטפורמת Kling AI בכתובת app.klingai.com.

השוואת מפרטים