Факты

Название Google Gemini
Официальный сайт deepmind.google
Документация ai.google.dev/gemini-api/docs
Чат gemini.google.com
Страна США
Разработчик Google / Google DeepMind
Доступ

Быстрые ссылки

История релизов

  • 2026-06 — Обновление линейки Gemini 3: на странице моделей выделены Gemini 3.1 Pro, Gemini 3.5 Flash, Gemini 3 Flash и Gemini 3.1 Flash‑Lite как основные модели; подтверждён статус серии 2.0 Flash / Flash‑Lite как «отключена» и вынесение их в блок Предыдущие модели.
  • 2026-03-02 — Gemini 3.1 Flash‑Lite: анонс новой быстрой и бюджетной модели серии 3 с ценой $0.25 за 1M входных и $1.50 за 1M выходных токенов, 1M контекстом, улучшенным качеством относительно 2.5 Flash и поддержкой thinking‑уровней; сначала в превью, затем переведена в GA как gemini-3.1-flash-lite.
  • 2026-03-09 — Вывод Gemini 3 Pro Preview: модель gemini-3-pro-preview перенесена в Предыдущие модели и отключена; рекомендован переход на gemini-3.1-pro (в API используется идентификатор gemini-3.1-pro / gemini-3.1-pro-preview в зависимости от среды).
  • 2026-02–03 — Уточнение графика вывода 2.5 Flash / Pro: в документации и форуме разработчиков подтверждены планы по деактивации gemini-2.5-flash и gemini-2.5-pro летом–осенью 2026 года и указаны рекомендуемые преемники среди серии 3 (3.1 Flash‑Lite / 3 Flash / 3.5 Flash).
  • 2026-01-26 — Google AI Plus: запуск более дешёвого плана с доступом к премиальным возможностям Gemini (включая 3‑ю серию и Nano Banana Pro) за $7.99/месяц в США и ряде стран, с акцией −50% первые два месяца.
  • 2025-12–2025-11 — Выход Gemini 3 серии: Gemini 3 Pro и Gemini 3 Flash, а также режим Gemini 3 Deep Think; модели сфокусированы на усиленных рассуждениях, GPQA Diamond и SWE‑bench, с поддержкой режима рассуждений.
  • 2025-10–12 — Линейка 2.5 (Pro / Flash / Flash‑Lite / Image / Computer Use) и ранние модели Live/TTS: запуск серии 2.5 как основного поколения до серии 3, с длинным контекстом 1 048 576 токенов и набором инструментов (Поиск, Карты, поиск по файлам, Computer Use, Live API, TTS); позже анонсирован график вывода моделей 2.5 в пользу 3‑й серии.

Модели (API)

ID (для API) Тип / режим Контекст Кратко Поддержка / ограничения Цены ($/1 млн) Документация
gemini-3.1-pro Мультимодальная, рассуждающая (флагман серии 3) ~1 048 576 вход; ~65 536 выход Передовая модель с усиленными многошаговыми рассуждениями, кодом и агентными сценариями; рекомендуемый преемник Gemini 3 Pro Preview и альтернатива 2.5 Pro для задач высокого класса.
  • Поддержка thinking / thinking‑levels (управляемая глубина рассуждений), media_resolution и Thought Signatures (сигнатуры мысли) для стабильного контекста рассуждений.
  • Вызов функций, структурированный вывод, обоснование через Google Search и Карты, поиск по файлам, выполнение кода, контекст URL — полнофункциональный набор инструментов.
  • Мультимодальность: текст, код, изображения, аудио, видео, PDF (входы), текст (выход).
по данным страницы цен: от ~$5–8 за 1M входных и ~$25–30 за 1M выходных токенов в зависимости от тарифа и региона (уточнять в актуальной таблице цен). документация
gemini-3.5-flash Мультимодальная, быстрая (3.5, рабочая) ~1 048 576 вход; ~65 536 выход Новая быстрая модель серии 3.5 с передовым уровнем производительности для агентов и кода, позиционируется как «самая интеллектуальная модель для длительных агентных и кодовых задач» и используется как дефолтный «Auto»‑вариант во многих клиентах.
  • Поддерживает режим рассуждений, инструментальные вызовы, Search/Maps, Поиск по файлам, Live API и контекстное кэширование.
  • Рекомендуется для агентов, сложного кода и долгих диалогов, где важны и качество, и скорость.
вход: $1.50; выход: $9.00 (включая thinking‑токены), в бесплатном слое — ограниченный объём использования. документация
gemini-3-flash Мультимодальная, быстрая (3, передовая) ~1 000 000 вход; ~65 536 выход Быстрая модель Gemini 3 с производительностью уровня frontier при меньшей цене, чем у флагманских reasoning‑моделей; показывала 90.4% GPQA Diamond, 81.2% MMMU Pro и 78% SWE‑bench Verified в ранних релизах.
  • Поддержка функций, структурированного вывода, Search/Maps, Поиск по файлам, выполнения кода и URL‑контекста.
  • Поддержка Computer Use (через специализированную модель и инструмент) для автоматизации браузера и интерфейсов.
  • Подходит для чат‑ботов, суммаризации, кода и мультимодального анализа при жёстких ограничениях по задержке.
вход: порядка $0.50 за 1M токенов (текст/изображение/видео) и ~$1.00 за аудио; выход: ~$3.00 — ориентироваться на актуальную таблицу цен. документация
gemini-3.1-flash-lite Мультимодальная, экономичная (3.1, GA) 1 048 576 вход; 65 535 выход Самая дешёвая и быстрая модель серии 3, оптимизированная для высокообъёмных, чувствительных к цене задач; по качеству стремится к 2.5 Flash и превосходит 2.5 Flash‑Lite, 2.0 Flash/Flash‑Lite по ключевым бенчмаркам.
  • Поддерживает Grounding (Search), выполнение кода, Supervised fine‑tuning, Continuous tuning, System instructions, Function calling, Structured output, Thinking, явное и неявное кэширование контекста.
  • Не поддерживает Gemini Live API и ряд продвинутых функций наподобие Preference Tuning.
  • GA‑версия gemini-3.1-flash-lite доступна с мая 2026; превью‑версия gemini-3.1-flash-lite-preview будет отключена 9 июля 2026.
вход: $0.25; выход: $1.50 за 1M токенов (серия 3 официально позиционирует эти цены в блоге). документация
gemini-2.5-pro Мультимодальная, рассуждающая (2.5, стабильная, планируется вывод) ~1 048 576 вход; ~65 536 выход Флагман 2.5 для кода и сложных рассуждений; до появления 3‑й серии была основной «большой» моделью Google для сложных задач, сейчас рассматривается как стабильная база для продакшна с анонсированным графиком замены.
  • Полный набор инструментов (Search/Maps, Поиск по файлам, Code Execution, URL‑контекст, Structured output).
  • Плановый вывод модели в рамках общей миграции с 2.5 на 3.x/3.5; рекомендуется закладывать переход на 3.1 Pro / 3.5 Flash.
типично: вход $1.25/$2.50 (≤/≥200k), выход $10/$15 за 1M — см. актуальную таблицу цен. документация
gemini-2.5-flash Мультимодальная, рассуждающая (2.5 Flash, планируется вывод) 1 048 576 вход; 65 536 выход Бюджетная модель серии 2.5 с управляемым «мышлением» и хорошим балансом цены и качества; для новых проектов Google рекомендует мигрировать на 3 Flash / 3.1 Flash‑Lite.
  • Вызов функций, Structured output, Search/Maps, Поиск по файлам, Batch API, кэширование контекста.
  • На странице deprecations указана дата плановой деактивации (осень 2026), что требует двухступенчатой миграции для команд, уходящих с 2.0 Flash на 2.5 Flash, а затем на 3.x.
ориентир: вход ~$0.30 (текст/изображения/видео) / ~$1.00 (аудио), выход ~$2.50 за 1M. документация
gemini-2.5-flash-lite Экономичная (2.5) 1 048 576 вход; 65 536 выход Минимальная цена и задержка в серии 2.5; оптимизирована под высокие объёмы и простые задачи; помечена к выводу с переходом на 3.1 Flash‑Lite.
  • Инструменты и структурированный вывод поддерживаются, но для новых проектов рекомендуется 3.1 Flash‑Lite.
ориентир: вход ~$0.10 / выход ~$0.40 за 1M (проверять в актуальной таблице цен). документация
nano-banana-2 (gemini-3.1-flash-image) Генерация изображений (Nano Banana 2) ~65 536 вход; ~32 768 выход Новое поколение встроенной генерации изображений с улучшенным рендерингом текста, до 4K, до 14 референсных изображений и поддержкой Обоснование через поиск (в том числе для поиска по изображениям).
  • Stable статус; рекомендуется как базовая модель для массовой генерации изображений вместо 2.5 Flash Image.
цены зависят от тарифов Gemini Media в таблице цен; обычно фиксированная цена за изображение. документация
nano-banana-pro (gemini-3-pro-image) Генерация изображений (Nano Banana Pro) ~65 536 вход; ~32 768 выход Профессиональная модель изображений с reasoning‑ядром и поддержкой 4K, сложной вёрстки и аккуратного текста; используется в AI Plus / Pro / Ultra и в Google Flow.
  • Предназначена для студийного качества, креативных и брендовых материалов.
см. раздел Pricing: обычно выше, чем Nano Banana 2. документация
veo-3.1 / veo-3.1-lite Генерация видео до нескольких минут видео (зависит от варианта) Семейство Veo 3.1 — генерация видео с кинематографическим контролем, высокими разрешениями и синхронизированным аудио.
  • Доступно через Gemini API и Google Flow / AI Pro / Ultra; ориентировано на продакшн‑уровень видео.
цены зависят от длительности и разрешения, указаны в отдельной секции Video. документация
computer-use Автоматизация интерфейсов (Computer Use) ~128 000 вход; ~64 000 выход Специализированная модель для управления экранами, браузером и UI‑элементами (клик, ввод текста, прокрутка и пр.), доступная как самостоятельная модель и как инструмент для моделей серии 3.
  • Предварительный доступ; требует строгих мер безопасности и ручных проверок действий.
тарификация близка к 2.5 Pro / 3 Pro в зависимости от конфигурации. документация

Ключевые особенности

  • Развёртывание через Google AI Studio (Gemini API), Vertex AI и Gemini Enterprise Agent Platform; единая экосистема для разработчиков и корпоративных пользователей.
  • Режимы «мышления» и управляемые уровни рассуждений (thinking / thinking_level) в сериях 2.5, 3 и 3.5; Gemini 3 Deep Think и Deep Research / Deep Research Max как усиленные агентные режимы с увеличенным test‑time compute.
  • Вызов функций, структурированный вывод, инструменты и обоснование через Google Search и Карты, а также контекст URL и выполнение кода (Code Execution) во всех основных моделях текста/кода.
  • Поиск по файлам (Поиск по файлам) — встроенная система RAG с семантическим поиском и индексированием документов; есть лимиты по размеру/количеству объектов и отдельная тарификация за индексирование и хранение.
  • Управление компьютером (Computer Use) для автоматизации браузерных и, частично, настольных интерфейсов через отдельную модель и инструмент; интеграция в агентные сценарии с пошаговым контролем.
  • Собственные модели генерации изображений (Nano Banana / Nano Banana 2 / Pro), видео (Veo 3.1/3.1 Lite) и музыки (Lyria 3 Pro / Clip / RealTime) — доступны через те же учётные записи и биллинг.
  • Длинный контекст до 1M+ токенов для серий 2.5 и 3/3.5, с кэшированием контекста (implicit/explicit caching) и отдельной ценой за кэш‑хиты.
  • Gemini Live API для потоковых аудио‑ и мультимодальных взаимодействий (2.5 Flash Live, 3.1 Flash Live), с WebSocket‑интерфейсом для двунаправленного общения.
  • Batch API с заметной скидкой относительно стандартных запросов для асинхронной обработки, а также тарифы Provisioned Throughput / Pay‑as‑you‑go / Priority для крупных нагрузок.
  • Deep Research и Deep Research Max как отдельные агентные модели для многошагового сбора и синтеза информации с цитированием источников.

Рекомендации по применению

  • Gemini 3.5 Flash — основной выбор для сложных агентов, код‑ассистентов и пользовательских приложений, где нужны и качество frontier‑уровня, и приемлемая цена; особенно если используются подписки AI Plus / Pro / Ultra или платный API.
  • Gemini 3.1 Pro — сложные рассуждения, анализ, программирование, автономные агенты и сценарии типа Deep Research; лучше подходит там, где важнее качество reasoning, чем абсолютная скорость и стоимость.
  • Gemini 3 Flash — быстрые чат‑боты, суммаризация, коды и мультимодальные сценарии с ограниченным бюджетом; хорош якобы как промежуточная ступень между 3.1 Flash‑Lite и 3.5 Flash.
  • Gemini 3.1 Flash‑Lite — высокообъёмные, чувствительные к цене сценарии (чат, модерация, простая аналитика, массовая обработка мультимодальных запросов), где важны низкая цена и скорость, но всё ещё нужен уровень качества серии 3.
  • Gemini 2.5 Pro / Flash / Flash‑Lite — легаси‑модели для существующих продакшн‑нагрузок; при проектировании новых систем стоит сразу планировать миграцию на серию 3.x/3.5, учитывая объявленные даты деактивации.
  • Gemini 3‑серия медиа (Nano Banana 2 / Pro, Veo 3.1) — генерация изображений/видео профессионального уровня; Nano Banana 2 — для массовой генерации, Pro — для студийного качества, Veo 3.1 — для сложной работы с видео.
  • Computer Use — автоматизация браузера и UI в связке с Gemini 3/3.5; рекомендуется только при чётких ограничениях и в «песочнице» из‑за высокого риска влияния на реальные аккаунты и данные.

Ограничения и риски

  • Часть ключевых моделей (особенно новые версии 3.x/3.5 и Live/Deep Research/Antigravity‑агенты) имеет статус Preview или Experimental, что предполагает возможные изменения качества, цен, лимитов и интерфейсов API.
  • Снятие с эксплуатации 2.0 Flash / Flash‑Lite уже завершено, а 2.5 Flash / Pro / Flash‑Lite / часть медиа‑моделей имеют объявленные даты deprecation; это создаёт риск для систем, жёстко привязанных к устаревшим идентификаторам, и требует планирования миграций.
  • Поиск, Grounding и Поиск по файлам тарифицируются отдельно после базового бесплатного пакета; при активном использовании Search‑обоснований и Поиск по файлам нужно учитывать дополнительную стоимость.
  • Gemini Live API и Computer Use требуют отдельной конфигурации и строгих мер безопасности (особенно управление компьютером), включая поэтапное подтверждение действий и sandbox‑окружения.
  • Стоимость зависит не только от длины промпта и ответа, но и от уровня режима рассуждений и типов медиа (аудио, видео дороже текста/изображений); для высокоинтенсивных задач рекомендуется Batch API, Flex/Provisioned Throughput и контекстное кэширование.
  • Дата отсечения знаний для серии 3.1 Flash‑Lite и большинства моделей — январь 2025 года; для более свежих данных рекомендуется Обоснование через поиск или внешние источники.
  • Функции Deep Research, Deep Research Max, расширенная генерация видео (Veo 3.1) и режимы Deep Think/Omni доступны только или в первую очередь в платных планах Google AI Plus / Pro / Ultra, что влияет на доступность для конечных пользователей.

Сравнение цен

Чат (подписка)

Провайдер План / уровень Цена (USD) Ссылка
Google Google AI Plus $7.99 / месяц в США (с 50% скидкой первые 2 месяца для новых подписчиков) страница
Google Google AI Pro $19.99 / месяц; включает расширенные лимиты и, по новым условиям, YouTube Premium Lite в ряде стран. страница
Google Google AI Ultra ($100) $100 / месяц (новый план с I/O 2026, 5× лимиты AI Pro, YouTube Premium, 20 TB хранилища и доступ к Gemini Spark). страница
Google Google AI Ultra ($200) $200 / месяц (бывший топ‑тариф Ultra за $250, теперь пониженный до $200; 20× лимиты Pro и доступ к Project Genie). страница
OpenAI ChatGPT Plus $20 / месяц цены
Anthropic Claude Pro $20 / месяц цены

API (модели)

Провайдер Модель / ID вход, $/1 млн выход, $/1 млн Примечания
Google gemini-3.5-flash $1.50 $9.00 (включая thinking‑токены) Фронтир‑уровень для агентов и кода; отдельное кэширование контекста и Batch‑скидки.
Google gemini-3.1-pro ориентир ~$5–8 (по стандартным Pay‑as‑you‑go тарифам) ориентир ~$25–30 Флагман reasoning; точные цены и региональные варианты — на странице цен.
Google gemini-3-flash ~$0.50 (текст/изображения/видео), ~$1.00 (аудио) ~$3.00 Быстрая модель серии 3; конкретные значения зависят от тарифа (Standard / Flex / Batch).
Google gemini-3.1-flash-lite $0.25 $1.50 Самая дешёвая модель 3‑й серии; рекомендуется для высокообъёмных нагрузок вместо 2.5 Flash‑Lite.
Google gemini-2.5-pro $1.25 / $2.50 (≤/≥200k) $10.00 / $15.00 Легаси‑флагман; планируется деактивация, рекомендован переход на 3.1 Pro.
Google gemini-2.5-flash ~$0.30 (текст/изображения/видео), ~$1.00 (аудио) ~$2.50 Переходная модель; будет отключена в пользу 3.5 Flash.
Google gemini-2.5-flash-lite ~$0.10 ~$0.40 Экономичный вариант серии 2.5; для новых проектов лучше сразу 3.1 Flash‑Lite.
OpenAI gpt-5 $1.25 $10.00 Флагман OpenAI по состоянию на 2026 год.
Anthropic claude-sonnet-4.5 $3.00 $15.00 Сопоставим с 3.5 Flash / 3.1 Pro по классу задач.

Бенчмарки

Провайдер Модель / ID GPQA (Diamond) Humanity’s Last Exam MMMU Pro SWE-bench Verified Источник
Google Gemini 3.1 Flash‑Lite ≈86.9% не указано ≈76.8% официально
Google Gemini 3 Flash ≈90.4% ≈33.7% ≈81.2% ≈78% официально
Google Gemini 3 Deep Think до ≈93–94% (в зависим. от режима) ≈48.4% (обновление 2026) официально
Google Gemini 2.5 Pro ≈83% ≈18.8% ≈81.7% ≈63.8% официально
OpenAI GPT-4o ~65–70% ~31–32% агрегаторы и обзоры
Anthropic Claude 3.5 Sonnet 67.2% ≈78–79% официально

Обновления на июнь 2026

  • Serия Gemini 3.5 / 3.1 Flash‑Lite в фокусе: Google чётко позиционирует 3.5 Flash и 3.1 Pro как фронтирные модели для агентов и кода, а 3.1 Flash‑Lite — как самый дешёвый, но всё ещё «передового класса» вариант для высокообъёмных задач.
  • Полный вывод Gemini 2.0 Flash / Flash‑Lite: к 1 июня 2026 все идентификаторы 2.0 Flash и Flash‑Lite переведены в статус отключена, с прямой миграцией на 2.5 Flash / Flash‑Lite и анонсом последующей миграции на 3.5 Flash.
  • Плавный переход с 2.5 на 3.x: в документации и на форуме разработчиков указано, что текущие проекты на 2.5 Flash / Pro должны планировать миграцию на серию 3 до конца 2026 года, чтобы избежать двойного cut‑over за 4–5 месяцев.
  • Обновлённые AI‑подписки: Google AI Plus за $7.99, Pro за $19.99 и новые варианты Ultra за $100 и $200/месяц дают доступ к Gemini Omni, 3.5 Flash, 3.1 Pro, Nano Banana Pro, Veo 3.1, Deep Research и экспериментальному агенту Gemini Spark (Ultra).
  • Compute‑based лимиты: переход от дневных лимитов промптов к модели на основе потреблённого compute (особенно для Pro/Ultra), с пятичасовыми окнами обновления лимитов и возможностью докупать top‑up кредиты.