«Бабушка, почитай мне»: почему клонирование голоса — технология будущего
В июле 2022 года на конференции re: MARS (мероприятии Amazon, которое посвящено искусственному интеллекту: машинному обучению, автоматизации, робототехнике и космосу) ведущий специалист и вице-президент ИИ Alexa Рохит Прасад решил впечатлить аудиторию «оккультным» трюком: разговором с мертвыми. «Хотя искусственный интеллект не избавит от горечи утраты, он поможет сохранить воспоминания», — сказал он. Затем Прасад показал короткое видео с мальчиком, который спрашивает Alexa, может ли бабушка дочитать ему «Волшебника из Страны Оз».
Голос, который зачитывает несколько предложений из книги, действительно похож на голос пожилой женщины. Но, не зная эту конкретную бабушку, по-настоящему сравнить их невозможно. Эта презентация показалась многим зрителям не просто пугающей — в журнале об информационных технологиях Ars Technica назвали увиденное «нездоровым». После демонстрации видеоролика Прасад раскрыл секрет «трюка»: специалисты Amazon сумели воспроизвести голос бабушки с помощью минутной аудиозаписи. И они способны сделать то же самое практически с любым голосом — это и захватывающе, и пугающе одновременно.