В будущем фильмы будет озвучивать искусственный интеллект
Фильм или ТВ-шоу, которые вы будете смотреть в скором времени, могут оказаться «работой» искусственного интеллекта.
Представьте, что актеры Голливуда, Болливуда или любых других студий говорят на родном для вас языке в любом из новых фильмов или шоу. На самом деле, это вполне реальная история, вот только голоса могут не принадлежать человеку — все это дипфейки, правда, не мошеннические, а созданные самими киностудиями с использованием ИИ.
Уже сейчас видео- и голосовые дипфейки вполне сносно копируют оригинал А в ближайшем будущем эти технологии станут еще более совершенными. Компании смогут получать копии голосов актеров, говорящих на самых разных языках.
И это будут не лишенные выражения «голоса» вроде современных цифровых агентов, а очень реалистичные голоса, снабженные эмоциями. Цифровые актеры смогут плакать, смеяться, бормотать — причем максимально близко к оригинальной озвучке.
ИИ постепенно проникает в эту отрасль, синтезируя не просто голоса актеров. Технологии позволяют «омолодить» голос, то есть фильм, в котором снимается пожилой актер, может быть снабжен «молодым» голосом этого человека.
Кроме того, можно создавать и вовсе искусственные голоса, которые принадлежат уже умершим актерам или тем из них, кто потерял голос. Ну и да, сами актеры при этом могут сидеть дома и пить чай, не утруждая себя выездом на студию звукозаписи. Да и домашняя студия в этом случае совсем не нужна.
При этом производитель фильма вовсе не обязан рассказывать зрителю о том, что голос — синтезированный. Одно дело роботы колл-центра, и совсем другое — озвучка фильмов или ТВ-шоу.
Совсем недавно при помощи ИИ был озвучен на разные языки фильм “Every Time I Die” 2019 года. Это была одна из первых попыток заменить голос актера дубляжа цифровым агентом. И все получилось — даже разработчик этой технологии далеко не всегда мог отличить синтезированный голос от настоящего.
Обучить нейросеть, которая послужит основой для очередного голоса актера, просто. Для этого нужно всего 5 минут записи, где переводчик наговаривает текст поверх английского оригинала.
Сейчас технология уже используется. Например, она применялась в «Мандалорце», когда показывали Люка Скайуокера. Дипфеком заменили голос настоящего Марка Хэмилла, которому уже 70 лет.
Об этом студия особо не распространялась, но это вполне реальный проект. Причем подавляющее большинство зрителей не осознавало, что голос — ненастоящий.
По словам создателя технологии, обычно человек улавливает голос, синтезированный ИИ. Его выдает ряд признаков, включая отсутствие эмоций, некая «металличность» и прочее. Сейчас же этих барьеров нет и человеку стало очень сложно отличить настоящий голос от дипфейка.
Дипфейки подобного рода могут использоваться не только для озвучки фильмов, но и для другого контента, включая видеоигры. Переозвучивать можно и старые фильмы с поврежденной или не очень естественной аудиодорожкой. ИИ справляется с этими задачами без особых проблем.
Источник: habr.com