חברת Adobe מציגה את VoCo – פוטושופ לאודיו

מצגת Adobe VoCo

בכל כמה שנים יוצאת לאוויר העולם טכנולוגיה שפשוט מרגישה כמו קסם בלתי אפשרי. טכנולוגיית VoCo של Adobe היא אחת כזו. הטכנולוגיה החדשה מאפשרת לערוך בצורה נוחה ופשוטה קטעי דיבור – למחוק מילים , להזיז אותן, ואפילו להכניס מילים חדשות. התוצאה הסופית נשמעת אמינה וטבעית ותואמת את קולו של הדובר, גם כאשר הטקסט המוקרא מיוצר כולו בידי המחשב.

המילים מיוצרות באמצעות אלגוריתמי עיבוד מתקדמים אשר מנתחים את צורת הדיבור של הדובר, מפרקים אותה לחלקים ומרכיבים ממנה מילים שנשמעות טבעיות לחלוטין. האלגוריתמים אינם דורשים מידע רב אודות קולו של הדובר (20 דקות מספיקות, לדברי המציגים, אך הזמן צפוי להשתפר). צפו בסרטון הבא על מנת להבין במה מדובר:

כפי שניתן לראות בסרטון, הטכנולוגיה עובדת בצורה מופלאה ומאפשרת ליצור קטעי קול בהם אנשים אומרים מילים שהמחשב מעולם לא שמע. הקסם האמיתי נמצא בממשק העריכה הפשוט, שמזהה בצורה מדוייקת את המילים השונות ומאפשר לערוך את קטע הקול בקלות בדיוק כאילו היה קובץ טקסט – היישר מתוך סרטי המדע הבדיוני. משמעות הדבר היא שטכנולוגיית VoCo תהיה נגישה להמונים וכל אחד יוכל לעשות בה שימוש.

אם כל אחד יוכל לעשות בה שימוש, היא עשוייה בקלות להגיע לידיים הלא נכונות (כפי שציינו המציגים בסרטון). לדוגמה, ניתן ליצור קטעי קול מפלילים הקבילים בבית משפט, או להסית בקלות אדם אחד נגד חברו – וזהו רק קצה הקרחון. על מנת להילחם בתופעות מסוג זה, Adobe פיתחה דרך מתוחכמת להטמיע את חותם התוכנה בקובץ השמע כך שלא יישמע בידי האוזן האנושית, אך יזוהה בקלות באמצעות תוכנה שיועדה לכך. החותם יישמר גם לאחר עיבודי קול והמרות שונות, על מנת לחסום נסיונות שונים להסרתו.

הטכנולוגיה החדשה נמצאת כעת בשלב ראשוני בלבד, וצפוי לעבור עוד זמן רב עד שתגיע אל השוק. אם וכאשר תגיע אל השוק, סביר להניח שלא תשולב בתוך תוכנת עריכת התמונות פוטושופ אם כי בתוכנת עריכת הקול מבית Adobe, אשר עונה לשם Audition. כל מה שנותר לנו לעשות כעת הוא לחכות.

השוואת מפרטים