Google представила обновленную версию своей мемной модели генерации изображений Nano Banana. Новая Nano Banana Pro обладает улучшенными способностями к рассуждению и следованию инструкциям, позволяя создавать более точные изображения с читаемым текстом и выполнять прецизионное редактирование существующих картинок. Об этом сообщает Ars Technica.
Что нового в Pro-версии
Nano Banana Pro является частью только что запущенного Gemini 3 Pro — технически модель называется Gemini 3 Pro Image, аналогично тому как оригинал был Gemini 2.5 Flash Image, но компания сохранила мемное название. Доступ к ней можно получить, выбрав Gemini 3 Pro и активировав опцию «Создавать изображения».
Google заявляет, что новая модель способна следовать сложным запросам для создания более точных изображений. Модель настолько способна, что может генерировать полностью готовые инфографики одним махом без странных AI-закорючек вместо слов. Nano Banana Pro также лучше поддерживает консистентность в изображениях. Инструмент позволяет смешивать до 14 изображений и сохранять внешний вид до пяти людей в результатах.
Компания также обещает улучшенное редактирование. Можно дорабатывать AI-изображения или предоставлять Nano Banana Pro фотографию и выполнять локализованные правки с меньшим количеством AI-глюков. Модель может даже изменять ключевые элементы изображения, такие как углы камеры, цветокоррекция и освещение, не затрагивая другие элементы.
- Генерация инфографик в один проход
- Смешивание до 14 изображений
- Поддержка консистентности до 5 персонажей
- Локализованное редактирование без изменения остального контента
- Рендеринг до 4K разрешения
Детекция AI-контента и водяные знаки
Google не просто раздувает шумиху — новый генератор изображений действительно стал значительно лучше. Его понимание мира и нюансов языка очевидно, производя гораздо более реалистичные результаты. Даже до этого AI-изображения стали настолько хороши, что их стало сложно отличить с первого взгляда. Прошли времена, когда можно было просто посчитать пальцы для идентификации AI.
Изображения, сгенерированные с Nano Banana Pro, продолжают иметь встроенные водяные знаки SynthID, которые могут обнаруживать инструменты Google. Компания также добавляет больше метаданных C2PA для дальнейшей маркировки AI-изображений.
Приложение Gemini также участвует в этом процессе. Сейчас можно загрузить изображение и спросить что-то вроде «Это AI?» Приложение не будет обнаруживать любые старые AI-изображения, но сообщит, если это продукт Google AI, проверив наличие SynthID.
В то же время Google делает несколько сложнее определение того, что изображение было сгенерировано с помощью AI. Осознавая, что профессионалы могут захотеть генерировать изображения с Nano Banana Pro, компания убрала видимый водяной знак с изображений для подписчиков AI Ultra. Эти изображения все еще имеют SynthID, но только младшие тарифы имеют мерцание Gemini в углу.
Интересно наблюдать, как Google пытается балансировать между доступностью и монетизацией AI-инструментов. С одной стороны — мемное название и бесплатный доступ для всех, с другой — жесткие лимиты использования и платные преимущества. Nano Banana Pro действительно выглядит серьезным шагом вперед в генеративной графике, но главный вопрос — насколько эти улучшения будут заметны обычным пользователям за пределами маркетинговых заявлений.
Тарифные ограничения
Хотя все могут получить доступ к новой Nano Banana Pro сегодня, подписчики AI Ultra будут пользоваться самыми высокими лимитами использования. Пользователи Gemini Pro получат немного меньше доступа, а бесплатные пользователи получат самые низкие лимиты перед понижением до непрофессиональной версии.
Модель доступна всем в приложении Gemini, но бесплатные пользователи быстро упрутся в ограничения использования. Это классическая стратегия Google: дать попробовать, чтобы потом продать полную версию.
Модель уже доступна в сервисах Vertex AI и Google Workspace, а в ближайшее время появится в Gemini Enterprise.
Оставить комментарий