Google nano banana - новая модель для редактирования изображений в Gemini

Google представила модель nano banana для редактирования изображений в Gemini с улучшенной консистентностью и возможностью сохранять детали при многократных правках.

Оглавление

Что умеет новая модель
Технические особенности

Google DeepMind раскрыла детали новой модели редактирования изображений под названием «nano banana», которая демонстрирует беспрецедентную консистентность при обработке фотографий. Модель, технически известная как Gemini 2.5 Flash Image, уже доступна в приложении Gemini и вскоре появится в API для разработчиков.

Что умеет новая модель

Ключевое преимущество nano banana — способность сохранять детали исходного изображения при многократных правках. В отличие от предыдущих генеративных моделей, которые могли непредсказуемо изменять элементы, новая система «запоминает» контекст и обеспечивает стабильный результат.

Среди практических применений Google выделяет:

Изменение стиля одежды или внешнего вида человека на фото
Трансформацию в различные образы (от матадора до персонажа сериала 90-х)
Слияние нескольких изображений в новую композицию

Технические особенности

Модель поддерживает последовательное редактирование — даже после серии правок результат сохраняет сходство с исходным материалом. Как и другие генеративные системы Google, все изображения помечаются видимым водяным знаком «AI» и невидимым цифровым идентификатором SynthID.

Консистентность редактирования — именно тот рубеж, после которого генеративные модели перестают быть игрушкой и становятся профессиональным инструментом. Способность сохранять контекст через множество итераций открывает возможности для реальной работы с контентом, а не просто развлечения. Круто! Одобряем!

Новая модель уже доступна в приложении Gemini, а в ближайшее время появится в Gemini API, AI Studio и Vertex AI для разработчиков. По сообщению Google Blog, система уже показала лучшие результаты в тестах LMArena leaderboard.

Новости

Google представила модель nano banana для консистентного редактирования изображений в Gemini

Что умеет новая модель

Технические особенности

Еще интереснее

В Google придумали, обновлять убеждения LLM при получении новой информации

OpenAI представила GPT-5.4: агентная автономность и прямой контроль интерфейсов

Институт Аллена выпустил новую версию гибридной модели Olmo Hybrid 7B

ИИ от Meta* не ограничивается только Llama: что известно про проекты Mango и Avocado

Оставить комментарий