Материал раздела Основной

«Бабушка, почитай мне»: почему клонирование голоса — технология будущего

Технологии синтеза речи быстро развиваются, и ИТ-компании способны воссоздать практически любой голос — как звезды шоу-бизнеса, так и умершего родственника. Эксперты видят много возможностей для применения разработок, но предупреждают о возможных рисках
Фото: Unsplash
Фото: Unsplash

В июле 2022 года на конференции re: MARS (мероприятии Amazon, которое посвящено искусственному интеллекту: машинному обучению, автоматизации, робототехнике и космосу) ведущий специалист и вице-президент ИИ Alexa Рохит Прасад решил впечатлить аудиторию «оккультным» трюком: разговором с мертвыми. «Хотя искусственный интеллект не избавит от горечи утраты, он поможет сохранить воспоминания», — сказал он. Затем Прасад показал короткое видео с мальчиком, который спрашивает Alexa, может ли бабушка дочитать ему «Волшебника из Страны Оз».

Голос, который зачитывает несколько предложений из книги, действительно похож на голос пожилой женщины. Но, не зная эту конкретную бабушку, по-настоящему сравнить их невозможно. Эта презентация показалась многим зрителям не просто пугающей — в журнале об информационных технологиях Ars Technica назвали увиденное «нездоровым». После демонстрации видеоролика Прасад раскрыл секрет «трюка»: специалисты Amazon сумели воспроизвести голос бабушки с помощью минутной аудиозаписи. И они способны сделать то же самое практически с любым голосом — это и захватывающе, и пугающе одновременно.