Факты

Название Google Gemini
Официальный сайт deepmind.google
Документация ai.google.dev/gemini-api/docs
Чат gemini.google.com
Страна США
Разработчик Google / Google DeepMind
Доступ

Быстрые ссылки

История релизов

  • 2026-03-09 — Отключение Gemini 3 Pro Preview в Gemini API и перенос модели в раздел предыдущих моделей (Previous models); рекомендован переход на gemini-3.1-pro-previewссылка
  • 2026-02-12 — Обновление Gemini 3 Deep Think: объявлен новый рекорд на Humanity’s Last Exam (≈48.4%) и улучшения на других академических бенчмарках — ссылка
  • 2026-01-29 — Инструмент управления компьютером для Gemini 3 Pro и Gemini 3 Flash: инструмент управления компьютером (Computer Use) официально поддерживается в gemini-3-pro (через режимы в приложении) и gemini-3-flash-preview через инструмент computer_use в Gemini API — ссылка
  • 2026-01-26 — Google AI Plus: более дешёвый план подписки с доступом к Gemini 3 Pro, функции глубокого исследования (Deep Research) и Nano Banana Pro в приложении Gemini — ссылка
  • 2026-01-22 — Анонс вывода моделей Gemini 2.0 Flash и Flash-Lite из эксплуатации; в актуальной документации дата отключения перенесена на 1 июня 2026 года, рекомендован переход на Gemini 2.5 Flash и 2.5 Flash-Lite — ссылка
  • 2026-01-03 — Агентное зрение (Agentic Vision) для Gemini 3 Flash: активное «исследующее» зрение для улучшения качества мультимодального восприятия — ссылка
  • 2025-12-17 — Gemini 3 Flash: выпуск в статусе предварительного доступа (превью) на Vertex AI и Google AI Studio; 90.4% GPQA Diamond, 81.2% MMMU Pro, 78% SWE-bench Verified, в 3 раза быстрее, чем 2.5 Pro, и составляет менее четверти от стоимости Gemini 3 Pro — ссылка
  • 2025-12-15 — Функция глубокого исследования (Gemini Deep Research) с визуальными отчётами — ссылка
  • 2025-12-10 — Обновления синтеза речи: Gemini 2.5 Flash TTS и Gemini 2.5 Pro TTS в предварительном доступе — ссылка
  • 2025-12-09 — Отключение Gemini 2.0 Flash Live и Gemini Live 2.5 Flash Preview — ссылка
  • 2025-11-18 — Gemini 3.0 Pro: выпуск на Vertex AI, Google AI Studio и мобильное приложение Gemini — ссылка
  • 2025-11-18 — Gemini 3 Deep Think: режим глубокого рассуждения для AI Ultra — ссылка
  • 2025-11-05 — Инструмент поиска по файлам: публичный выпуск с бесплатным хранилищем и семантическим поиском — ссылка
  • 2025-10-07 — Gemini 2.5 Computer Use (предварительный доступ): выпуск специализированной модели для автоматизации интерфейсов и браузера — ссылка

Модели (API)

ID (для API) Тип / режим Контекст Кратко Поддержка / ограничения Цены ($/1 млн) Документация
gemini-3-flash-preview Мультимодальная, быстрая (передовая) 1 000 000 вход; 65 536 выход Быстрая модель серии 3: 90.4% GPQA Diamond, 81.2% MMMU Pro, 78% SWE-bench Verified; ~3x быстрее 2.5 Pro при существенно более низкой цене.
  • Предварительный доступ в Gemini API, Google AI Studio и Vertex AI
  • Вызов функций, структурированный вывод, обоснование (Поиск / Карты), поиск по файлам, контекст URL, выполнение кода
  • Поддержка управления компьютером через инструмент computer_use (браузер и частично мобильные сценарии)
  • Поддерживает thinking_level (динамическое «мышление»), пакетный API (Batch API) и кэширование контекста
вход: $0.50 (текст/изображения/видео), $1.00 (аудио); выход: $3.00 документация
gemini-3.1-pro-preview Мультимодальная, рассуждающая (флагман серии 3) 1 000 000 вход; 65 536 выход Следующее поколение Gemini 3: улучшенные многошаговые рассуждения, код и агентные сценарии; 44.4% Humanity’s Last Exam и 94.3% GPQA Diamond в режиме высокого уровня размышлений (Thinking High).
  • Предварительный доступ в Gemini API и Google AI Studio; рекомендованный преемник для Gemini 3 Pro Preview
  • Поддержка thinking_level, media_resolution, сигнатур мыслей (Thought Signatures) для стабильного контекста рассуждений
  • Вызов функций, структурированный вывод, обоснование через Поиск / Карты, поиск по файлам, выполнение кода, контекст URL
  • Сложные задачи в области STEM, анализ больших документов и кодовых баз
вход: $2.00 (≤200k) / $4.00 (>200k); выход: $12.00 (≤200k) / $18.00 (>200k) документация
gemini-3.1-flash-lite-preview Мультимодальная, экономичная (3.1), управляемое «мышление» 1 000 000 вход; 65 536 выход Рабочая лошадка серии 3: минимальная цена и задержка, поддержка thinking_level с профилем по умолчанию minimal; бесплатный уровень в Gemini API.
  • Вызов функций, обоснование через Поиск / Карты, поиск по файлам, структурированный вывод, пакетный API
  • Оптимизирована под высокие объемы, чат-ботов и простые агентные сценарии
  • Поддержка Gemini Live API через специализированные модели Live
вход: $0.25 (текст/изображения/видео), $0.50 (аудио); выход: $1.50 документация
gemini-2.5-pro Мультимодальная, рассуждающая 1 048 576 вход; 65 536 выход Флагман 2.5 для кода и сложных рассуждений; стабильная модель для рабочей среды (продакшена) с поддержкой длинного контекста.
  • Вызов функций, структурированный вывод, обоснование через Поиск / Карты, поиск по файлам, контекст URL, выполнение кода
  • Кэширование контекста и пакетный API для снижения стоимости на длинных запросах
  • Стабильная версия; объявлено о будущем снятии с эксплуатации к 17 июня 2026 года с рекомендацией перехода на Gemini 3.1 Pro / 3 Flash
вход: $1.25 (≤200k) / $2.50 (>200k); выход: $10.00 (≤200k) / $15.00 (>200k) документация
gemini-2.5-flash Гибридные рассуждения (вкл/выкл) 1 048 576 вход; 65 536 выход Ускоренная 2.5 с управляемым «мышлением» и хорошим балансом качества, цены и скорости; основная модель для массовых задач.
  • Вызов функций, обоснование через Поиск / Карты, поиск по файлам, структурированный вывод, пакетный API, кэширование контекста
  • Рекомендована для массовой суммаризации, чат-ботов и извлечения структурированных данных
  • Помечена как модель с плановым отключением 17 июня 2026 года; рекомендованный преемник — gemini-3-flash-preview
вход: $0.30 (текст/изображения/видео), $1.00 (аудио); выход: $2.50 документация
gemini-2.5-flash-lite Экономичная (2.5), рассуждающая 1 048 576 вход; 65 536 выход Минимальная цена и задержка в серии 2.5; для высоких объемов и периферийных вычислений, где важна цена.
  • Вызов функций, обоснование через Поиск / Карты, поиск по файлам, структурированный вывод; пакетный API и кэширование контекста
  • Оптимизирована под дешевое масштабирование и простые задачи
  • Плановое отключение 22 июля 2026 года с переходом на gemini-3.1-flash-lite-preview
вход: $0.10 (текст/изображения/видео), $0.30 (аудио); выход: $0.40 документация
gemini-2.5-flash-image Собственный генератор изображений (Nano Banana) 65 536 вход; 32 768 выход Быстрый генератор и редактор изображений Nano Banana (Gemini 2.5 Flash Image); оптимизирован для высоких объемов и низкой задержки.
  • Собственный генератор и редактор изображений (поколение 2.5)
  • Общедоступна в Gemini API, Google AI Studio и Vertex AI
  • Плановое отключение 2 октября 2026 года; рекомендуемый преемник — gemini-3.1-flash-image-preview (Nano Banana 2)
вход: $0.30 (текст/изображение); выход: ≈$0.039 за изображение документация
gemini-2.5-computer-use-preview-10-2025 Автоматизация интерфейсов (Computer Use) 128 000 вход; 64 000 выход Специализированная модель на базе 2.5 Pro для управления веб-интерфейсами и браузерной автоматизации через инструмент Computer Use.
  • Инструмент управления компьютером: клики, ввод текста, прокрутка, перетаскивание и др.
  • Оптимизирована под браузеры; для новых проектов Google рекомендует использовать функцию управления компьютером в Gemini 3 Flash, но модель 2.5 остается основой многих готовых решений
  • В статусе предварительного доступа; тарификация как у Gemini 2.5 Pro
вход: $1.25 (≤200k) / $2.50 (>200k); выход: $10.00 (≤200k) / $15.00 (>200k) документация

Ключевые особенности

  • Развертывание через Google AI Studio (Gemini API) и Vertex AI; единая экосистема для разработчиков и корпоративных пользователей.
  • Режимы «мышления» и управляемые уровни рассуждений (thinking_level) в сериях 2.5 и 3; Gemini 3 Deep Think как усиленный режим глубокого рассуждения для сложных задач.
  • Вызов функций, структурированный вывод, инструменты и обоснование через Google Search и Карты, а также контекст URL и выполнение кода.
  • Поиск по файлам — интегрированная система извлечения и расширения контекста с семантическим поиском и бесплатным хранилищем на старте.
  • Управление компьютером (Computer Use) для автоматизации браузерных и частично мобильных интерфейсов, доступно как через специализированную модель 2.5, так и непосредственно в Gemini 3 Flash.
  • Собственные модели генерации изображений: Gemini 2.5 Flash Image (Nano Banana), Gemini 3 Pro Image (Nano Banana Pro) и Gemini 3.1 Flash Image (Nano Banana 2).
  • Собственные модели генерации видео (Veo 3, Veo 3.1 Fast) через Gemini API и подписки AI Pro / Ultra.
  • Длинный контекст до 1 млн и более токенов во всех моделях 2.5 и 3; у 3-й серии — до 1 000 000 на входе и 64 тыс. на выходе.
  • Gemini Live API для потоковых мультимодальных взаимодействий: аудиовывод, двунаправленный WebSocket, поддержка функций и моделей с рассуждением (Thinking).
  • Кэширование контекста для оптимизации стоимости на длинных запросах, с отдельной тарификацией за хранение и считывание.
  • Пакетный API (Batch) с примерно 50% скидкой для асинхронной обработки запросов.
  • Глубокое исследование (Deep Research) с визуальными отчетами для подписчиков AI Ultra и расширенная функция глубокого исследования для AI Pro / Plus.
  • Страница статуса и журнал инцидентов с гарантиями уровня обслуживания (SLA) для платных планов.

Рекомендации по применению

  • Gemini 3 Flash — основная быстрая модель для продуктивных приложений, чат-ботов, агентных сценариев с управлением компьютером и мультимодального анализа при строгих ограничениях по цене и задержке.
  • Gemini 3.1 Pro — передовые рассуждения, сложный анализ, программирование, автономные агенты и сценарии типа глубокого исследования (Deep Research); приоритетный выбор для задач, где важны качество и глубина вывода.
  • Gemini 3 Deep Think — режим глубокого рассуждения для подписчиков AI Ultra (приложение и ограниченный доступ в API); задачи STEM, сложная математика, исследовательские сценарии с максимальным объемом вычислений во время тестирования (test-time compute).
  • Gemini 3.1 Flash-Lite — высокообъемные сценарии, чувствительные к цене (чат, простая аналитика, классификация), где требуется серия 3, но минимальная стоимость.
  • Gemini 2.5 Pro — альтернатива 3.1 Pro для рабочей среды (продакшена) для критичных нагрузок с уже отлаженным поведением; стоит учитывать объявленное снятие с эксплуатации к лету 2026 года и планировать переход.
  • Gemini 2.5 Flash — основная рабочая модель для приложений с контролем цены и скорости: массовая суммаризация, чат, извлечение структурированных данных; хороша как переходный вариант перед переходом на Gemini 3 Flash.
  • Gemini 2.5 Flash-Lite — высокообъемные сценарии (обработка логов, простые классификации), максимально чувствительные к цене; закладывать переход на Gemini 3.1 Flash-Lite к середине 2026 года.
  • Gemini 2.5 Flash Image / Nano Banana — быстрая генерация и редактирование изображений, если не требуется максимальное качество и новые возможности 3-й серии Gemini; для новых проектов предпочтительнее Nano Banana 2 / Pro.
  • Gemini 2.5 Computer Use — автоматизация интерфейсов и браузера, если нужен специализированный агент с устойчивым поведением и примером от Google; для новых разработок рекомендуется рассматривать инструмент управления компьютером в Gemini 3 Flash.

Ограничения и риски

  • Все модели серии Gemini 3 (включая 3.1 Pro, 3 Flash, 3.1 Flash-Lite, 3 Pro Image и 3.1 Flash Image) находятся в статусе предварительного доступа (превью); возможны изменения качества, цен и интерфейсов API.
  • Gemini 3 Deep Think остается режимом предварительного доступа для подписчиков AI Ultra и может иметь повышенную задержку и стоимость из-за увеличенного объема вычислений во время вывода (test-time compute).
  • Обоснование через Google Search и Google Maps тарифицируется отдельно после бесплатного лимита (5 000 запросов в стандартном режиме, затем ~$14 за 1 000 запросов).
  • API реального времени (Gemini Live API) требует использования WebSocket и отдельной конфигурации моделей Live / Flash Live.
  • Поиск по файлам имеет ограничения по размеру хранилища и количеству индексируемых объектов; сверх лимита взимается плата за индексирование и хранение.
  • Управление компьютером (Computer Use) остается функцией в предварительном доступе и требует дополнительных мер безопасности, в т.ч. пошаговых проверок действий и явного подтверждения критичных операций.
  • Цены зависят от модели и типа тарифа (стандартный / пакетный), использования кэширования и обоснования; при планировании бюджета важно учитывать стоимость токенов рассуждения (thinking).
  • Актуальность знаний моделей серии 2.5 и 3 — примерно январь 2025 года; для более свежих данных рекомендуется обоснование через Поиск (Search Grounding).
  • Функция глубокого исследования (Deep Research), расширенная генерация видео (Veo 3 / 3.1) и режим Deep Think доступны только в платных планах Google AI Pro / Ultra.
  • Модели серии Gemini 2.0 Flash и Flash-Lite помечены как устаревшие (Deprecated) и будут окончательно отключены 1 июня 2026 года; модели 2.5 Flash / Flash-Lite / Flash Image также имеют объявленные даты отключения летом–осенью 2026 года, поэтому новые проекты должны опираться на 3-ю серию.

Сравнение цен

Чат (подписка)

Провайдер План / уровень Цена (USD) Ссылка
Google Google AI Plus $7.99 / месяц в США (акция −50% первые 2 месяца) страница
Google Google AI Pro $19.99 / месяц страница
Google Google AI Ultra $124.99 / 3 месяца (≈$41.66 / месяц) страница
OpenAI ChatGPT Plus $20 / месяц цены
OpenAI ChatGPT Pro $200 / месяц цены
Anthropic Claude Pro $20 / месяц цены
Mistral Le Chat Pro ≈€14.99 / месяц цены

API (модели)

Провайдер Модель / ID вход (≤200k), $/1 млн вход (>200k), $/1 млн выход, $/1 млн
Google gemini-3-flash-preview $0.50 (текст/изображения/видео), $1.00 (аудио) $0.50 (текст/изображения/видео), $1.00 (аудио) $3.00
Google gemini-3.1-pro-preview $2.00 $4.00 $12.00 / $18.00
Google gemini-2.5-pro $1.25 $2.50 $10.00 / $15.00
Google gemini-2.5-flash $0.30 (текст/изображения/видео), $1.00 (аудио) $0.30 (текст/изображения/видео), $1.00 (аудио) $2.50
Google gemini-2.5-flash-lite $0.10 (текст/изображения/видео), $0.30 (аудио) $0.10 (текст/изображения/видео), $0.30 (аудио) $0.40
OpenAI gpt-4o $2.50 $2.50 $10.00
Anthropic claude-3.5-sonnet $3.00 $3.00 $15.00

Бенчмарки

Провайдер Модель / ID GPQA (Diamond) Humanity’s Last Exam MMMU Pro SWE-bench Verified Источник
Google Gemini 3 Deep Think 93.8% ≈48.4% (обновление 2026) не указано не указано официально, обновление в LinkedIn
Google Gemini 3.1 Pro 94.3% 44.4% не указано не указано официально
Google Gemini 3 Flash 90.4% 33.7% 81.2% 78% официально
Google Gemini 2.5 Pro 83.0% 18.8% 81.7% 63.8% официально
Google Gemini 2.5 Flash 82.8% не указано не указано не указано официально
OpenAI GPT-4o ~65.6% ~31.6% не указано не указано официально / сторонние обзоры
Anthropic Claude 3.5 Sonnet 67.2% не указано 78.7% не указано официально
xAI Grok-4 87.5% не указано не указано не указано официально

Обновления на март 2026

  • Gemini 3.1 Pro Preview — новое поколение флагманской модели с улучшенными бенчмарками (94.3% GPQA Diamond, 44.4% Humanity’s Last Exam) и расширенным контролем параметров thinking_level / media_resolution.
  • Gemini 3.1 Flash-Lite Preview — бюджетная модель серии 3 с поддержкой thinking_level и бесплатным уровнем (tier), рекомендованная для высокообъемных задач вместо 2.5 Flash-Lite.
  • Gemini 3.1 Flash Image (Nano Banana 2) — новое поколение встроенной генерации изображений с улучшенным рендерингом текста, до 4K, 14 эталонными (референсными) изображениями и обоснованием (Grounding) через Google Search (включая поиск по изображениям).
  • Gemini 3 Pro Image (Nano Banana Pro) — профессиональная модель для изображений с продвинутым рассуждением (Thinking) и поддержкой 4K для студийных визуальных материалов.
  • Отключение Gemini 3 Pro Preview — модель перенесена в предыдущие модели (Previous models) и выключена 9 марта 2026 года; рекомендован переход на gemini-3.1-pro-preview.
  • Снятие с эксплуатации 2.0 и 2.5 Flash-линейки — Gemini 2.0 Flash / Flash-Lite полностью помечены как устаревшие (Deprecated) с отключением 1 июня 2026 года, а 2.5 Flash / Flash-Lite / Flash Image — с датами отключения летом–осенью 2026 года, с рекомендуемыми моделями-преемниками в серии 3.
  • Gemini 3 Deep Think — обновление февраля 2026 года с ростом результата на Humanity’s Last Exam до ≈48.4% и улучшениями в ряде сложных бенчмарков; режим доступен через AI Ultra.
  • Gemini 2.5 Pro / Flash / Flash-Lite — обновленные карточки моделей с единым лимитом 1 048 576 входных и 65 536 выходных токенов и полным набором инструментов (Поиск, Карты, поиск по файлам, выполнение кода, рассуждение).
  • Расширение Computer Use — помимо специализированной модели 2.5 Computer Use, поддержка инструмента управления компьютером официально добавлена в Gemini 3 Flash в Vertex AI и Gemini API.
  • Уточненная тарификация — через официальную страницу цен Gemini API и сторонние калькуляторы подтверждены цены 2026 года для 3-й и 2.5-й серий, а также скидки пакетного API (≈50%).