מחולל התמונות Midjourney מציג תמונות ריאליסטיות מתמיד בגרסה V5

דוגמא ל-Midjourney V5 (מקור juliewdesign@) תמונה: Julie W. Design דרך Midjourney V5

חברת Midjourney, המפתחת את מחולל תמונות מבוסס טקסט בעל אותו השם, השיקה גרסת אלפא V5 חדשה של מחולל ה-Midjourney, מודל חדש המאפשר ליצור תמונות באיכות פוטוריאליסטית יותר בהשוואה לגרסה הקודמת.

הגרסה החדשה מגיעה עם יכולת ליצור תמונות ברזולוציה גבוהה יותר, עם טווח דינמי משופר וקלט בשפה טבעית ופשוטה יותר. המודל זמין נכון לרגע זה רק למנויים בתשלום של החברה (החל מ-10 דולר בחודש).

עוברים ל-Midjourney V5

בזמן שתשומת הלב המרכזית של רובנו בתחום הבינה המלאכותית היום קשור לצ’אטבוט ChatGPT של OpenAI עם השקת מודל ה-GPT-4 והשילוב שלו במנוע החיפוש בינג ושירות ה-Microsoft 365, תחום מרכזי לא פחות, שניתן למצוא בו הרבה יותר “תחרות” הוא זה של מחוללי התמונות מבוססי הטקסט, בהם Imagen, DALL·E, Stable Diffusion ו-Midjourney, שקיבל לאחרונה עדכון למודל ה-V5.

אחד השינויים הגדולים ביותר בגרסת ה-V5 החדשה של Midjourney הוא היכולת לייצר תמונות פוטוריאליסטיות בהשוואה ל-V4, ולטשטש עוד יותר את הגבול בין תמונה אמיתית וכזו שמיוצרת על ידי מודל בינה מלאכותית.

דוגמאות לכך ניתן למצוא במגוון דוגמאות שניתן שהופיעו בימים האחרונים ברשת, כאשר אחד מהשיפורים הגדולים הוא היכולת של המודל החדש ליצור ידיים אנושיות בצורה טובה יותר (ועם 5 אצבעות), דבר שהיה בעייתי במודל הקודם.

בדוגמאות מטה ביצענו השוואה בין תמונה של מנכ”ל מטא, מארק צוקרברג, מרכיב משקפי מציאות מדומה, בגרסה V5 מול גרסה V4, כשאת ההבדל הגדול ביותר ניתן למצוא בתמונה העליונה מימין:

ה-V5 החדש נוצר על ידי אימון המודל בשרתי ה-AI supercluster בענן של גוגל, כאשר החברה מתייחסת ל-V5 כגרסה “מקצועית” של ה-Midjourney המאפשרת ליצור תמונות ברזולוציה גבוהה פי 2 מהדור הקודם, עם טווח דינמי רחב יותר ומגוון סגנונות.

יותר מכל, מביאה עימה הגרסה החדשה את היכולת להבין טקסט בצורה טבעית יותר, כך שאין צורך לכתוב הנחיות (Prompt) בצורה נקודתית עם פסיקים וכו’, אלא כתיאור טבעי יותר של התמונה שרוצים לקבל, כאשר תיאור ארוך יותר יוכל לייצר תמונות באיכות גבוהה יותר, כפי שניתן לראות בדוגמאות הבאות של Julie W. Design למשל:

בניגוד למודל ה-V4 הקודם של Midjourney שזמין לכלל המשתמשים בחינם דרך שרת הדיסקורד של החברה, מודל ה-V5 החדש זמין רק בעבור המנויים בתשלום, מנוי שמתחיל במחיר של 10 דולר בתשלום חודשי (פחות מכך עם מנוי שנתי). החברה מדגישה כי לא מדובר על הגרסה הסופית של מודל ה-V5, אלא רק בגרסה מוקדמת שלו.

קשה שלא להתפעל מאיכות התמונות אותן מייצר מודל V5 החדש של Midjourney, במיוחד אחרי שמבינים כי מדובר בגרסת אלפא בלבד, מה שאומר שאנו צפויים לראות לא מעט שיפורים בגרסה הסופית של המודל, דבר שיטשטש עוד יותר את הגבול בין אומנות וצילום לבין תמונות אותן יוצרים מודלי בינה מלאכותית.

השוואת מפרטים