Оглавление
Компания Synthesia представила новое поколение AI-аватаров, которые поражают реалистичностью мимики, жестов и голосовых интонаций. Технология Express-2 позволяет создавать цифровые копии людей, почти неотличимые от реальных записей, сообщает Technology Review.
Эволюция цифровых двойников
Когда Synthesia запускалась в 2017 году, её аватары были довольно примитивными — например, цифровой Дэвид Бекхэм говорил на разных языках, но движения были резкими, эмоции не совпадали с выражением лица, а акценты сбивались. К 2020 году компания начала предлагать корпорациям создавать презентационные видео с AI-версиями сотрудников, но качество всё ещё оставляло желать лучшего.
Новая модель Express-2 кардинально меняет ситуацию. Аватары теперь обладают:
- Естественными мимическими движениями
- Плавной жестикуляцией, синхронизированной с речью
- Сохраняющимися акцентами оригинала
- Эмоционально окрашенной речью
Личный опыт создания цифрового двойника
Процесс создания аватара значительно упростился по сравнению с прошлым годом. Если ранее требовалась длительная калибровка системы, чтение скриптов в разных эмоциональных состояниях и артикуляция звуков для обучения модели, то теперь достаточно часовой съёмки.
Технический руководитель Synthesia Джош Бейкер-Мендоса инструктирует: «Двигайте руками как при естественном разговоре, но не слишком активно». Результат — гиперреалистичный аватар, который выглядит и звучит как оригинал, хотя и с некоторыми особенностями.
Ирония в том, что технология, созданная для персонализации контента, на самом деле стандартизирует поведение. Все аватары Express-2 превращаются в идеальных корпоративных спикеров с неестественным энтузиазмом — словно выпускники курсов мотивационного коучинга. Для бизнес-презентаций это работает, но для личного общения такой фейковый оптимизм будет вызывать только отторжение.
Технологические ограничения и психологический эффект
Несмотря на впечатляющий прогресс, мелкие артефакты всё ещё выдают искусственное происхождение аватаров:
- Слишком гладкие ладони как из пластилина
- Жёсткие, статичные пряди волос
- Стеклянный, редко моргающий взгляд
- Небольшие рывки в движениях тела
Анна Айзербек, исследователь психологии из Университета Гумбольдта в Берлине, отмечает: «Что-то казалось пустым. Я знаю, что за этим нет реальных эмоций — это не сознательное существо. Оно ничего не чувствует». Этот эффект «зловещей долины» пока остаётся непреодолённым барьером.
Будущее интерактивных аватаров
Следующий шаг — создание аватаров, способных на двустороннее общение. Но здесь возникают не только технические, но и этические вопросы. Как отмечает профессор искусственного интеллекта Университета Аугсбурга Бьёрн Шуллер, главная задача сейчас — не внешнее сходство, а воспроизведение естественного поведения.
Уже сейчас можно представить сценарии злоупотреблений: от создания компрометирующих записей с чужими аватарами до манипуляции общественным мнением. Synthesia позиционирует себя как корпоративный инструмент, но технология неизбежно найдёт применение за пределами бизнес-презентаций.
Оставить комментарий