Материал раздела Технологии

Говорящая голова: что будет, когда ИИ обретет еще и визуальный образ

Виртуальный персонаж с искусственным интеллектом, способный поддержать беседу на разных языках, продемонстрировать эмоции, выполнить поручения, — это будущее многих сфер деятельности. Илья Иванов («Наносемантика») рассказал о технологии цифровых аватаров
Фото: Midjourney
Фото: Midjourney

В последнем исследовании Gartner Hype Cycle for Emerging Technologies собраны 25 самых перспективных технологий, и среди них — «цифровые люди» (Digital Humans). Несмотря на достаточно высокую в сравнении с другими зрелость технологии (она расположена на середине восходящей кривой), период ее развития до выхода на плато один из наиболее длинных — десять лет. Одна из причин — технические требования к платформам и девайсам, в которые цифровые люди смогут полноценно интегрироваться.

Что это за технология и где ее будут применять?

Суть технологии

Цифровой аватар — это 3D-персонаж, созданный на основе технологий искусственного интеллекта: видеоаналитики, нейросетей, распознавания голоса и синтеза речи.

Такого виртуального героя можно обучить говорить на любом языке, а сам он может двигаться, понимать собеседника и даже распознавать его по внешности, чтобы сформулировать подходящий ответ. Например, информация для взрослого мужчины будет отличаться от той, которую получит ребенок.

Цифровой аватар может «жить» на любом экране — компьютера, смартфона, билборда или специального девайса. Его можно интегрировать в любое решение — на веб-сайт, в мобильное приложение, облачный сервис, видеоигру или метавселенную.

Технологии сегодня уже позволяют создавать самые простые цифровые аватары без глубоких знаний в обработке естественного языка (NLP), синтезе речи или веб-дизайне.