Synthesia создала гиперреалистичные AI-аватары с экспрессивной мимикой

Synthesia представила AI-аватары нового поколения с экспрессивной мимикой и естественными жестами. Технология достигла уровня, когда цифровые копии почти неотличимы от реальных людей.

Оглавление

Эволюция цифровых двойников
Личный опыт создания цифрового двойника
Технологические ограничения и психологический эффект
Будущее интерактивных аватаров

Компания Synthesia представила новое поколение AI-аватаров, которые поражают реалистичностью мимики, жестов и голосовых интонаций. Технология Express-2 позволяет создавать цифровые копии людей, почти неотличимые от реальных записей, сообщает Technology Review.

Эволюция цифровых двойников

Когда Synthesia запускалась в 2017 году, её аватары были довольно примитивными — например, цифровой Дэвид Бекхэм говорил на разных языках, но движения были резкими, эмоции не совпадали с выражением лица, а акценты сбивались. К 2020 году компания начала предлагать корпорациям создавать презентационные видео с AI-версиями сотрудников, но качество всё ещё оставляло желать лучшего.

Новая модель Express-2 кардинально меняет ситуацию. Аватары теперь обладают:

Естественными мимическими движениями
Плавной жестикуляцией, синхронизированной с речью
Сохраняющимися акцентами оригинала
Эмоционально окрашенной речью

Кадр из видео от Synthesia

Личный опыт создания цифрового двойника

Процесс создания аватара значительно упростился по сравнению с прошлым годом. Если ранее требовалась длительная калибровка системы, чтение скриптов в разных эмоциональных состояниях и артикуляция звуков для обучения модели, то теперь достаточно часовой съёмки.

Технический руководитель Synthesia Джош Бейкер-Мендоса инструктирует: «Двигайте руками как при естественном разговоре, но не слишком активно». Результат — гиперреалистичный аватар, который выглядит и звучит как оригинал, хотя и с некоторыми особенностями.

Ирония в том, что технология, созданная для персонализации контента, на самом деле стандартизирует поведение. Все аватары Express-2 превращаются в идеальных корпоративных спикеров с неестественным энтузиазмом — словно выпускники курсов мотивационного коучинга. Для бизнес-презентаций это работает, но для личного общения такой фейковый оптимизм будет вызывать только отторжение.

Технологические ограничения и психологический эффект

Несмотря на впечатляющий прогресс, мелкие артефакты всё ещё выдают искусственное происхождение аватаров:

Слишком гладкие ладони как из пластилина
Жёсткие, статичные пряди волос
Стеклянный, редко моргающий взгляд
Небольшие рывки в движениях тела

Анна Айзербек, исследователь психологии из Университета Гумбольдта в Берлине, отмечает: «Что-то казалось пустым. Я знаю, что за этим нет реальных эмоций — это не сознательное существо. Оно ничего не чувствует». Этот эффект «зловещей долины» пока остаётся непреодолённым барьером.

Будущее интерактивных аватаров

Следующий шаг — создание аватаров, способных на двустороннее общение. Но здесь возникают не только технические, но и этические вопросы. Как отмечает профессор искусственного интеллекта Университета Аугсбурга Бьёрн Шуллер, главная задача сейчас — не внешнее сходство, а воспроизведение естественного поведения.

Уже сейчас можно представить сценарии злоупотреблений: от создания компрометирующих записей с чужими аватарами до манипуляции общественным мнением. Synthesia позиционирует себя как корпоративный инструмент, но технология неизбежно найдёт применение за пределами бизнес-презентаций.

Новости

Synthesia создала гиперреалистичные AI-аватары с экспрессивной мимикой и жестами

Эволюция цифровых двойников

Личный опыт создания цифрового двойника

Технологические ограничения и психологический эффект

Будущее интерактивных аватаров

Еще интереснее

Adobe открывает доступ к моделям OpenAI и Google в своих приложениях

Музыканты сталкиваются с нашествием ИИ-подделок на Spotify и других платформах

ИИ научили подражать стилю писателей на базе всего двух книг

Netflix делает ставку на генеративный ИИ для создания контента

Оставить комментарий