Оглавление

Компания Synthesia представила новое поколение AI-аватаров, которые поражают реалистичностью мимики, жестов и голосовых интонаций. Технология Express-2 позволяет создавать цифровые копии людей, почти неотличимые от реальных записей, сообщает Technology Review.

Эволюция цифровых двойников

Когда Synthesia запускалась в 2017 году, её аватары были довольно примитивными — например, цифровой Дэвид Бекхэм говорил на разных языках, но движения были резкими, эмоции не совпадали с выражением лица, а акценты сбивались. К 2020 году компания начала предлагать корпорациям создавать презентационные видео с AI-версиями сотрудников, но качество всё ещё оставляло желать лучшего.

Новая модель Express-2 кардинально меняет ситуацию. Аватары теперь обладают:

  • Естественными мимическими движениями
  • Плавной жестикуляцией, синхронизированной с речью
  • Сохраняющимися акцентами оригинала
  • Эмоционально окрашенной речью

Кадр из видео от Synthesia

Личный опыт создания цифрового двойника

Процесс создания аватара значительно упростился по сравнению с прошлым годом. Если ранее требовалась длительная калибровка системы, чтение скриптов в разных эмоциональных состояниях и артикуляция звуков для обучения модели, то теперь достаточно часовой съёмки.

Технический руководитель Synthesia Джош Бейкер-Мендоса инструктирует: «Двигайте руками как при естественном разговоре, но не слишком активно». Результат — гиперреалистичный аватар, который выглядит и звучит как оригинал, хотя и с некоторыми особенностями.

Ирония в том, что технология, созданная для персонализации контента, на самом деле стандартизирует поведение. Все аватары Express-2 превращаются в идеальных корпоративных спикеров с неестественным энтузиазмом — словно выпускники курсов мотивационного коучинга. Для бизнес-презентаций это работает, но для личного общения такой фейковый оптимизм будет вызывать только отторжение.

Технологические ограничения и психологический эффект

Несмотря на впечатляющий прогресс, мелкие артефакты всё ещё выдают искусственное происхождение аватаров:

  • Слишком гладкие ладони как из пластилина
  • Жёсткие, статичные пряди волос
  • Стеклянный, редко моргающий взгляд
  • Небольшие рывки в движениях тела

Анна Айзербек, исследователь психологии из Университета Гумбольдта в Берлине, отмечает: «Что-то казалось пустым. Я знаю, что за этим нет реальных эмоций — это не сознательное существо. Оно ничего не чувствует». Этот эффект «зловещей долины» пока остаётся непреодолённым барьером.

Будущее интерактивных аватаров

Следующий шаг — создание аватаров, способных на двустороннее общение. Но здесь возникают не только технические, но и этические вопросы. Как отмечает профессор искусственного интеллекта Университета Аугсбурга Бьёрн Шуллер, главная задача сейчас — не внешнее сходство, а воспроизведение естественного поведения.

Уже сейчас можно представить сценарии злоупотреблений: от создания компрометирующих записей с чужими аватарами до манипуляции общественным мнением. Synthesia позиционирует себя как корпоративный инструмент, но технология неизбежно найдёт применение за пределами бизнес-презентаций.