Факты

Название Google Gemini
Официальный сайт deepmind.google
Документация ai.google.dev/gemini-api/docs
Чат gemini.google.com
Страна США
Разработчик Google / DeepMind
Доступ

Быстрые ссылки

История релизов

  • 2026-01-29 — Computer Use для Gemini 3 Pro и Gemini 3 Flash: инструмент управления компьютером официально поддерживается в gemini-3-pro-preview и gemini-3-flash-preview через новый инструмент computer_use в Gemini API — ссылка
  • 2026-01-26 — Google AI Plus: более дешёвый план подписки с доступом к Gemini 3 Pro, Deep Research и Nano Banana Pro в приложении Gemini — ссылка
  • 2026-01-22 — Анонс вывода моделей Gemini 2.0 Flash и Flash-Lite из эксплуатации к 31 марта 2026 года; рекомендована миграция на Gemini 2.5 Flash — ссылка
  • 2026-01-03 — Agentic Vision для Gemini 3 Flash: активное «исследующее» зрение для улучшения качества мультимодального восприятия — ссылка
  • 2025-12-17 — Gemini 3 Flash: релиз в превью на Vertex AI и Google AI Studio; 90.4% GPQA Diamond, 81.2% MMMU Pro, 78% SWE-bench Verified, в 3 раза быстрее, чем 2.5 Pro, менее четверти цены Gemini 3 Pro — ссылка
  • 2025-12-15 — Gemini Deep Research с визуальными отчётами — ссылка
  • 2025-12-10 — Обновления синтеза речи: Gemini 2.5 Flash TTS и Gemini 2.5 Pro TTS в превью — ссылка
  • 2025-12-09 — Отключение Gemini 2.0 Flash Live и Gemini Live 2.5 Flash Preview — ссылка
  • 2025-11-18 — Gemini 3.0 Pro: релиз на Vertex AI, Google AI Studio и мобильное приложение Gemini — ссылка
  • 2025-11-18 — Gemini 3 Deep Think: режим глубокого рассуждения для AI Ultra — ссылка
  • 2025-11-05 — Инструмент поиска по файлам: публичный релиз с бесплатным хранилищем и семантическим поиском — ссылка
  • 2025-10-07 — Gemini 2.5 Computer Use (превью): релиз специализированной модели для автоматизации интерфейсов и браузера — ссылка

Модели (API)

ID (для API) Тип / режим Контекст Кратко Поддержка / ограничения Цены ($/1M) Документация
gemini-3-flash-preview Мультимодальная, быстрая (передовая) 1,048,576 вход; 65,536 выход Быстрая альтернатива 3 Pro: 90.4% GPQA Diamond, 81.2% MMMU Pro, 78% SWE-bench Verified, ~3x быстрее 2.5 Pro, менее четверти цены 3 Pro.
  • Превью в Gemini API, Google AI Studio и Vertex AI
  • Вызов функций, структурированный вывод, обоснование через Google Search / Maps
  • Поиск по файлам, API реального времени (Gemini Live API), Agentic Vision для улучшенного зрения
  • Управление компьютером через инструмент Computer Use (превью)
вход: $0.50 (текст/изображения/видео), $1.00 (аудио); выход: $3.00 документация
gemini-3-pro-preview Мультимодальная, рассуждающая (флагман) 1,048,576 вход; 65,536 выход Следующее поколение: улучшенное программирование, мультимодальное понимание, агентные сценарии, передовые рассуждения.
  • Превью на Vertex AI и Google AI Studio
  • Улучшены: программирование, создание интерфейсов, многошаговые рассуждения, Deep Research
  • Вызов функций, структурированный вывод, обоснование, поиск по файлам
  • Управление компьютером через инструмент Computer Use (превью)
вход: $2.00 (≤200k) / $4.00 (>200k); выход: $12.00 (≤200k) / $18.00 (>200k) документация
gemini-3-deep-think-preview Мультимодальная, глубокое рассуждение 1,048,576 вход; 65,536 выход Режим глубокого рассуждения для Gemini 3 Pro; лучшие показатели на Humanity’s Last Exam.
  • Превью (только подписчики Google AI Ultra / AI Pro с доступом к AI Ultra в будущем)
  • Регулярные обновления качества
  • Оптимизирована для STEM-задач и математики
включена в подписку Google AI Ultra документация
gemini-2.5-pro Мультимодальная, рассуждающая 1,048,576 вход; 65,536 выход Флагман 2.5 для кода и сложных рассуждений; стабильная модель для продакшена.
  • Вызов функций, структурированный вывод, обоснование, поиск по файлам
  • Кэширование контекста; управление компьютером не поддерживается напрямую
  • Общая доступность; рекомендуется для критичных продакшн-нагрузок
вход: $1.25 (≤200k) / $2.50 (>200k); выход: $10.00 (≤200k) / $15.00 (>200k) документация
gemini-2.5-flash Гибридные рассуждения (вкл/выкл) до 1,000,000 Ускоренная 2.5 с управляемым «мышлением» и API реального времени; баланс качества, цены и скорости.
  • Вызов функций, обоснование, поиск по файлам, API реального времени (Gemini Live API)
  • До 1M контекста; бюджеты на «мышление»
  • Общая доступность; основная рабочая «лошадка» для масштабных задач
вход: $0.30 (текст/изображения/видео), $1.00 (аудио); выход: $2.50 документация
gemini-2.5-flash-lite Экономичная (2.5), рассуждающая до 1,000,000 Минимальная цена и задержка в серии 2.5; для высоких объёмов и периферийных вычислений.
  • Вызов функций, обоснование, поиск по файлам
  • До 1M контекста; бюджеты на «мышление»
  • Общая доступность; оптимизирована под дешёвое масштабирование
вход: $0.10 (текст/изображения/видео), $0.30 (аудио); выход: $0.40 документация
gemini-2.5-flash-image Собственный генератор изображений (Nano Banana) до 65,536 вход; 32,768 выход Встроенное создание и редактирование изображений в стиле Nano Banana; быстрый, с цифровым водяным знаком SynthID.
  • Собственный генератор и редактор изображений
  • Общая доступность в Gemini API, Google AI Studio и Vertex AI
  • Оптимизирован для высоких объёмов и низкой задержки
вход: $0.30 (текст/изображение); выход: ≈$0.039 за изображение документация
gemini-2.5-computer-use-preview-10-2025 Автоматизация интерфейсов (Computer Use) 128,000 вход; 64,000 выход Специализированная модель на базе 2.5 Pro для управления веб-интерфейсами и браузерной автоматизации через инструмент Computer Use.
  • Инструмент Computer Use: клики, ввод текста, прокрутка, перетаскивание и др.
  • Оптимизирована под браузеры; поддержка мобильных сценариев — в разработке
  • Превью; те же тарифы, что и Gemini 2.5 Pro
вход: $1.25 (≤200k) / $2.50 (>200k); выход: $10.00 (≤200k) / $15.00 (>200k) документация
gemini-2.0-flash Мультимодальная (2.0) до 1,000,000 Сбалансированная мультимодальная модель 2.0; стабильна, но объявлен вывод из эксплуатации 31 марта 2026 года.
  • Вызов функций, обоснование, API реального времени
  • Кэширование контекста
  • Общая доступность до 31.03.2026; далее будет отключена
вход: $0.10 (текст/изображения/видео), $0.70 (аудио); выход: $0.40 документация

Ключевые особенности

  • Развёртывание через Google AI Studio (Gemini API) и Vertex AI; единая экосистема для разработчиков и корпоративных пользователей.
  • Режимы «мышления» и управляемые бюджеты рассуждений в серии 2.5 и 3; Gemini 3 Deep Think для передовых рассуждений.
  • Вызов функций, структурированный вывод, инструменты и обоснование через Google Search и Карты.
  • Поиск по файлам — интегрированная система извлечения и расширения контекста с семантическим поиском и бесплатным хранилищем.
  • Управление компьютером (Computer Use) для автоматизации браузерных и частично мобильных интерфейсов.
  • Собственные модели генерации изображений: Gemini 2.5 Flash Image и Gemini 3 Pro Image.
  • Собственные модели генерации видео (Veo 3, Veo 3.1 Fast) через Gemini API и подписки AI Pro / Ultra.
  • Длинный контекст до 1M+ токенов в моделях 2.5 и 3.
  • Gemini Live API для потоковых мультимодальных взаимодействий: аудиовывод, двунаправленный WebSocket, поддержка функций.
  • Кэширование контекста для оптимизации стоимости на длинных запросах.
  • Пакетный API с примерно 50% скидкой для асинхронной обработки.
  • Deep Research с визуальными отчётами для подписчиков AI Ultra и расширенный Deep Research для AI Pro / Plus.
  • Страница статуса и журнал инцидентов с гарантиями уровня обслуживания (SLA) для платных планов.

Рекомендации по применению

  • Gemini 3 Flash — основная быстрая модель для продуктивных приложений, чат-ботов, API реального времени и мультимодального анализа.
  • Gemini 3 Pro — передовые рассуждения, сложный анализ, программирование и Deep Research.
  • Gemini 3 Deep Think — задачи STEM, сложная математика и исследования.
  • Gemini 2.5 Pro — продакшн-альтернатива 3 Pro для критичных нагрузок.
  • Gemini 2.5 Flash — основная рабочая модель для приложений с контролем цены и скорости: массовая суммаризация, чат, извлечение структурированных данных.
  • Gemini 2.5 Flash-Lite — высокообъёмные сценарии, чувствительные к цене.
  • Gemini 2.5 Flash Image — быстрая генерация и редактирование изображений.
  • Gemini 2.5 Computer Use — автоматизация интерфейсов и браузера.
  • Gemini 2.0 Flash — использовать только для поддержки существующих систем.

Ограничения и риски

  • Gemini 3 Pro и Flash остаются в статусе превью; возможны изменения качества, цен и интерфейсов API.
  • Gemini 3 Deep Think — превью только для подписчиков AI Ultra.
  • Обоснование через Google Search имеет отдельную тарификацию после бесплатного лимита.
  • API реального времени требует использования WebSocket и отдельной настройки.
  • Поиск по файлам имеет ограничения по размеру хранилища.
  • Computer Use — превью, требует дополнительных мер безопасности.
  • Цены зависят от модели и типа тарифа и могут меняться.
  • Актуальность знаний моделей — примерно январь 2025 года.
  • Deep Research и расширенная генерация видео доступны только в платных планах.
  • Модели Gemini 2.0 Flash и Flash-Lite будут отключены 31 марта 2026 года.

Сравнение цен

Чат (подписка)

Провайдер План / уровень Цена (USD) Ссылка
Google Google AI Plus $7.99 / месяц (в США; промо $3.99 первые 2 месяца) страница
Google Google AI Pro $19.99 / месяц страница
Google Google AI Ultra $249.99 / месяц страница
OpenAI ChatGPT Plus $20 / месяц цены
OpenAI ChatGPT Pro $200 / месяц цены
Anthropic Claude Pro $20 / месяц цены
Mistral Le Chat Pro ≈€14.99 / месяц цены

API (модели)

Провайдер Модель / ID вход (≤200k), $/1M вход (>200k), $/1M выход, $/1M
Google gemini-3-flash-preview $0.50 (текст/изображения/видео), $1.00 (аудио) $0.50 (текст/изображения/видео), $1.00 (аудио) $3.00
Google gemini-3-pro-preview $2.00 $4.00 $12.00 / $18.00
Google gemini-3-deep-think-preview в подписке AI Ultra в подписке AI Ultra в подписке AI Ultra
Google gemini-2.5-pro $1.25 $2.50 $10.00 / $15.00
Google gemini-2.5-flash $0.30 (текст/изображения/видео), $1.00 (аудио) $0.30 (текст/изображения/видео), $1.00 (аудио) $2.50
Google gemini-2.5-flash-lite $0.10 (текст/изображения/видео), $0.30 (аудио) $0.10 (текст/изображения/видео), $0.30 (аудио) $0.40
OpenAI gpt-4o $1.25 $1.25 $5.00
Anthropic claude-3.5-sonnet $3.00 $3.00 $15.00

Бенчмарки

Провайдер Модель / ID GPQA (Diamond) Humanity’s Last Exam MMMU Pro SWE-bench Verified Источник
Google Gemini 3 Deep Think 93.8% 41.0% не указано не указано официально
Google Gemini 3.0 Pro не указано 37.5% не указано не указано официально
Google Gemini 3 Flash 90.4% 33.7% 81.2% 78% официально
Google Gemini 2.5 Pro 83.0% 18.8% 81.7% 63.8% официально
Google Gemini 2.5 Flash 82.8% не указано не указано не указано официально
OpenAI GPT-4o ~65.6% ~31.6% не указано не указано официально / сторонние обзоры
Anthropic Claude 3.5 Sonnet 67.2% не указано 78.7% не указано официально
xAI Grok-4 87.5% не указано не указано не указано официально

Обновления на февраль 2026

  • Gemini 3 Flash — быстрая модель с высоким уровнем рассуждений и производительности.
  • Agentic Vision — улучшенное визуальное восприятие изображений.
  • Gemini Deep Research — создание визуальных аналитических отчётов.
  • Gemini 3 Pro — улучшенные рассуждения и программирование.
  • Gemini 3 Deep Think — режим глубокого рассуждения.
  • Обновления синтеза речи — улучшенная выразительность и естественность.
  • Поиск по файлам — встроенный семантический поиск с оплатой за индексирование.
  • Кэширование контекста — снижение стоимости при повторном использовании данных.
  • Пакетный API — скидка на асинхронную обработку.
  • Grounding через Google Search — обновлённая модель тарификации.
  • Google AI Plus — доступный тариф с расширенными возможностями.
  • Депрекация Gemini 2.0 Flash / Flash-Lite — отключение 31 марта 2026 года.