Оглавление

Команда Google DeepMind анонсировала масштабное обновление функции редактирования изображений в приложении Gemini, которое теперь позволяет сохранять идентичность персонажей при любых манипуляциях с фотографиями.

Сохранение идентичности при редактировании

Ключевым улучшением стала способность модели сохранять узнаваемость людей и животных при кардинальных изменениях изображения. Система теперь точно воспроизводит черты лица, особенности внешности и даже характерные черты домашних питомцев при смене причесок, стиля одежды или фона.

Технология демонстрирует значительный прогресс в области генеративного ИИ для изображений. Способность сохранять идентичность при трансформациях — это именно то, что отличает профессиональные инструменты от любительских.

Новые возможности редактирования

Обновление предлагает четыре основных типа преобразований:

  • Смена костюма или локации — перенос персонажей в новые окружения с сохранением внешности
  • Смешивание фотографий — создание композиций из нескольких изображений
  • Многоэтапное редактирование — последовательное изменение разных элементов сцены
  • Перенос стилей — применение текстур и паттернов с одного объекта на другой

Технические особенности

Все созданные или отредактированные изображения помечаются видимым водяным знаком и невидимым цифровым идентификатором SynthID, что позволяет легко определить их искусственное происхождение. Модель уже признана лучшей в мире по качеству редактирования изображений согласно независимым оценкам.

Обновление доступно в приложении Gemini с сегодняшнего дня.

По материалам Google DeepMind.