גוגל מוסיפה שמע למודל הוידאו Veo 3 ומציגה מציגה כלי חדש ליצירת וידאו

Imagen 4 ו-Veo 3 (מקור גוגל)

גוגל (Google) הכריזה במהלך אירוע המפתחים Google I/O 2025 שנערך אמש (ג’, 20.5) על אוסף פיתוחי AI חדשים, בהם Imagen 4 ו-Veo 3, מחוללי התמונות והוידאו המעודכנים של החברה, כאשר מחולל ה-Veo 3 מציע לראשונה אפשרות להוסיף לוידאו אותו הוא מייצר שמע תואם.

בנוסף, גוגל הציגה את ה-Flow, כלי קולנועי חדש המאפשר להשתמש בכלל מודלי ה-AI המתקדמים של החברה על מנת ליצור וידאו ותמונות בצורה נוחה וטובה יותר.

מחולל ה-Imagen 4: שיפור ביצירת תמונות

תחום מחוללי התמונות לא מפסיק להתפתח, כאשר מחולל ה-Imagen 4 החדש מחליף את Imagen 3 ומוטמע בתוך Gemini, עוזר ה-AI של גוגל, כאשר הוא מציג קפיצת מדרגה ביצירת תמונות עם רמת פירוט גבוהה ועיבוד טקסט משופר.

לפי גוגל, מחולל ה-Imagen 4 החדש מסוגל ליצור תמונות במהירות ועם רמת דיוק גבוהה, כאשר הוא מסוגל לייצר ולהציג בחדות פרטים עדינים כמו אריגים, טיפות מים ופרווה.

המודל יכול ליצור בסגנונות מציאותיים ומופשטים לפי הצורך, והוא גם בעל יכולת לייצר תמונות ברזולוציה גבוהה של עד 2K עם אפשרות בחירה של יחס גובה-רוחב של התמונה אותה הוא מייצר.

דוגמא לתמונה מ-Imagen 4 (מקור גוגל)
דוגמא לתמונה מ-Imagen 4 (מקור גוגל)

מחולל ה-Imagen 4 החדש זמין עכשיו באפליקציית Gemini, ב-Whisk וכלים נוספים.

גוגל מציינת כי זוהי הגרסה הראשונה של Imagen 4, כאשר החברה מתכננת להשיק בקרוב גרסה משופרת של Imagen 4 שתהיה מהירה עד פי 10 בהשוואה ל-Imagen 3 הקודם.

האודיו מגיע לוידאו עם Veo 3

מחולל ה-Veo 3 החדש מגיע גרסה האחרונה למחולל הוידאו Veo של גוגל, עם שדרוג משמעותי במיוחד בהשוואה למודלים מתחרים ומודל ה-Veo 2 הקודם של החברה. המודל החדש משפר כצפוי את איכות הוידאו אותו הוא מייצר, אך זהו לא החידוש המרכזי של המודל.

המודל החדש לא מסתפק רק ביצירת וידאו באיכות גבוהה, אלא מציע לראשונה בעולם אפשרות ליצור סרטונים עם שמע: רעש תנועה ברחוב עירוני, ציפורים מצייצות בפארק, ואפילו דיאלוג אמיתי בין דמויות.

מחולל הוידאו Veo 3 החדש זמין כעת למנויי Google AI Ultra בארצות הברית דרך אפליקציית Gemini או Flow, וגם למשתמשים ארגונים דרך Vertex AI. 

Flow: כלי AI קולנועי

Flow הוא כלי AI קולנועי חדשני שפותח בשיתוף פעולה עם יוצרי תוכן ולמענם. הוא משלב את המודלים המתקדמים ביותר של גוגל, ה-Google DeepMind – Veo, Imagen ו-Gemini – ומאפשר ליצור קליפים, סצנות וסיפורים שלמים באיכות קולנועית.

הכלי מציע פלטפורמה אחת אינטואיטיבית שבה המשתמש יכול לתאר סצינות בשפה טבעית, לארגן את כל המרכיבים הנחוצים, ולהפוך כל רעיון לסדרת סצינות.

כלי ה-Flow החדש של גוגל זמין בשלב הראשון למנויי תוכניות ה-Google AI Pro ו-Google AI Ultra בארה”ב בלבד, עם צפי להרחבת הזמינות למדינות נוספות בהמשך.

השוואת מפרטים