הרשמה לניוזלטר

טכנולוגיה חדשה מאפשרת לחקות קולות אנושיים לאחר האזנה של שניות ספורות

רקפת תבור | 1 באפריל 2018 | מדע וטכנולוגיה | 2 דק׳

שכפול קול, בקלות ובמהירות

באידו, חברת הענק הסינית, המוכרת בעיקר הודות למנוע החיפוש שלה – התחליף הסיני למנוע של גוגל, עובדת במרץ על טכנולוגיית “שכפול קול”. בתחילת 2017 היא דיווחה ש-Deep Voice, תוכנת בינה מלאכותית שהיא מפתחת, מסוגלת לחקות קולות אנושיים לאחר שהיא מאזינה להם במשך כמה שעות.

מאז, התוכנה של באידו משתפרת בקצב מסחרר. הגרסה שפורסמה במאי 2017, 2Deep Voice, דורשת רק חצי שעה של האזנה לקול מסוים כדי שתוכל לחקות אותו ביעילות, והיא יודעת לעבד מאות מבטאים שונים, למשל להשמיע את קולו של דונלד טראמפ במבטא בריטי. גרסה מתקדמת יותר, ששוחררה באוקטובר 2017, כבר יודעת ללמוד לחקות את קולותיהם של 2,500 אנשים שונים בו זמנית.

באמצע פברואר 2018, צוות המחקר והפיתוח של באידו פרסם מאמר מפורט המתאר את הטכנולוגיה שמאחורי המערכת, ואת הפיתוחים האחרונים שלה. מתברר שגרסתה הנוכחית זקוקה לשניות ספורות של נתונים מקולו של מישהו כדי להצליח לחקות אותו ביעילות. שדרוגים נוספים מאפשרים למערכת להמיר קול נשי לגברי ולהיפך ולשחק עם המבטא של הדובר.

אמנם המערכת אינה מושלמת עדיין, וניתן מדי פעם להבחין בסגנון דיבור מעט רובוטי שלה, אך לאור ההתקדמות המהירה שלה במהלך השנה האחרונה, ובהתחשב בעובדה שלפני קצת יותר משנה הדברים האלו כלל לא התאפשרו, כנראה שתכנית הבינה המלאכותית תמשיך להתקדם ולהשתדרג במהירות ותסגור את הפערים תוך זמן לא רב.

למעשה באידו אינה השחקנית היחידה בזירה. תוכנת VoCo של אדובי, שקיבלה גם את הכינוי “הפוטושופ של הקולות”, מסוגלת לחקות קולות לאחר שהיא מאזינה להם במשך 20 דקות. הסטארט אפ הקנדי Lyrebird מסוגל לחקות קולות אחרי שהוא מאזין להם במשך דקה בלבד. וגם גוגל משתתפת במרוץ, כשהיא מקדמת את תוכנת הבינה המלאכותית WaveNet כדי שתשולב בעוזר האישי שגוגל מפתחת ותאפשר לו להישמע טוב הרבה יותר.

מערכת כזו תאפשר לאנשים שאיבדו את קולם להשמיע אותו, כל עוד המערכת שמעה אותם מבעוד מועד. היא גם תוכל לעזור לפתח יישומים כדוגמת “עוזר אישי דיגיטלי” או תוכנות תרגום אוטומטיות כך שיישמעו זורמים ונעימים לאוזן הרבה יותר.

אבל, בעידן ה”פייק ניוז”, כשכבר קל כל כך ליצור סרטונים בהם פניו של אדם אחד מוצמדות לגוף של מישהו אחר, או כשכבר ניתן בקלות ליצור סרטונים משכנעים שמראים אנשים אומרים דברים שמעולם לא אמרו, מה יקרה כשטכנולוגיה כזו תשמש כדי להפיץ מידע שקרי וחדשות כוזבות? האם מעכשיו כל אחד מאתנו יוכל ליצור ציטוטים משכנעים וכוזבים של כל אדם שהוא?

שתפו את הכתבה:

כתבות נוספות שעשויות לעניין אותך
עלייתו של הצ׳יגונג ששינה את סין

דינה גורדון

שלוש שנים לאחר סיום מהפכת התרבות בסין, החלה להתפתח מהפכה נוספת שאיש לא צפה. ב-11 במארס 1979 פורסם ביומון הסיני "סיצ'ואן דיילי" מאמר...

מהארכיון: מה הקשר בין אייזיק ניוטון, תיבת נוח, ואלוהים

רקפת תבור

אם חשבתם שאייזיק ניוטון היה רק ממציא מדע המכניקה, כדאי שתחשבו שוב. בפברואר 2003 יצא היומון...

כיצד להפוך למבוגרים טובים יותר

מאיה מזרחי

ההורים של סינתיה בת ה-14 היו מבולבלים מאוד. מסיבות שהם לא יכלו להבין ההתנהגות של בתם השתנתה לבלי הכר בשנה האחרונה. היא הפכה...

השפה הנסתרת של החיות

דינה גורדון

נאמר על שלמה המלך שהוא היה החכם באדם. בין שאר כישוריו הוא ידע לדבר עם בעלי חיים, וזו אינה משימה קלה. מחקרים שנערכו בשנים...

“אז אתה אומר שיש ‘אני’ מקבילה ביקומים אחרים?” “כן. אבל היא אדם שונה ממך. היא כבר לא את”

רקפת תבור

בילדותו בסן...

מה עומד מאחורי הניסיון למנוע הפרדה מגדרית בקמפוסים החרדיים

נעמה זרביב

מזה כשנתיים אני מנסה להשמיע קול אחר במרחב הציבורי. קול שאינו משווה...

תחקיר: מאחורי הקלעים של הארגון האנרכיסטי שמאיים לפרק את הסדר החברתי

איל לוינטר, מאיה מזרחי, יאן יקיאלק

"יש לכם הזדמנות 'לנגוס בי' לפני שהבוזזים יספיקו לקבור אותי עמוק באדמה",...

הקולות ששמע היטלר

דינה גורדון

" אכלתי ארוחת ערב בתעלה, עם כמה חיילים אחרים. פתאום שמעתי [בראשי] קול שאומר לי: 'קום ולך למקום אחר'. הקול היה כל כך ברור ועקשני שצִייַתִּי באופן...

שתפו: