Разработчики Google представили обновление для своей нейросети Gemini, которое позволяет преобразовывать текстовые ответы и сложные наборы данных в динамические визуальные модели. Как сообщает The Decoder, пользователи теперь могут не просто изучать статические графики, но и самостоятельно менять переменные или вращать 3D-объекты непосредственно в окне диалога.

Внедрение такого функционала выглядит логичным шагом в попытке сделать взаимодействие с большими языковыми моделями более осязаемым. Вместо того чтобы продираться сквозь полотна текста, теперь можно попросить ИИ наглядно продемонстрировать концепцию, что значительно упрощает анализ информации и помогает быстрее вникнуть в суть сложных процессов.

Для того чтобы опробовать новые возможности на практике, достаточно зайти в браузерную версию на сайте gemini.google. Важно убедиться, что в настройках выбрана модель Pro, так как именно она поддерживает генерацию продвинутого контента. Процесс запуска визуализации интуитивно понятен и строится на привычной механике текстовых запросов.

Как активировать и использовать визуальные инструменты

Алгоритм работы с новыми функциями выглядит следующим образом: сначала вводится запрос, содержащий ключевые фразы вроде «покажи мне» или «помоги визуализировать». После этого система генерирует интерактивный виджет. Пользователь получает возможность настраивать параметры отображения, адаптируя графику под свои конкретные задачи или исследовательские нужды.

В качестве примера можно использовать промпт: «Визуализируй, как низкая конверсия переходов из ИИ-ответов на сайты-источники влияет на общий трафик в вебе». В ответ Gemini сформирует модель, где можно будет наглядно увидеть распределение потоков данных и оценить последствия для экосистемы интернета, которые порой неочевидны при чтении сухой статистики.

Интерактивные виджеты в чате выглядят эффектно и действительно упрощают восприятие данных на короткой дистанции, однако за этой фасадной эстетикой скрывается отсутствие глубокой интеграции с реальными аналитическими инструментами. Google пытается догнать конкурентов, предлагая визуальный суррогат, который хорош для презентаций, но пока не заменяет полноценную работу с BI-системами. Очередная попытка удержать пользователя внутри своей экосистемы, предлагая ему красивые картинки вместо реального контроля над данными.

Стоит заметить, что Google не является первопроходцем в этой области. Еще в середине марта компания Anthropic представила аналогичное решение для своего чат-бота Claude. Конкурирующая модель также умеет создавать интерактивные диаграммы и графики, когда считает это уместным или получает прямое указание от пользователя.

Подобная гонка вооружений в интерфейсах чат-ботов наводит на мысли о том, что эпоха «просто текста» в общении с ИИ постепенно уходит в прошлое. Однако за удобством всегда следуют нюансы: иногда интерактивные модели могут упрощать реальную картину мира до уровня красивой, но малоинформативной схемы, о чем стоит помнить при принятии серьезных решений на основе таких «быстрых» данных.