Gemini

Google Gemini — семейство мультимодальных больших языковых моделей с доступом через Gemini API и Vertex AI, а также потребительский веб‑чат Gemini (включая подписки Google AI Plus / Pro / Ultra). Актуальная линейка в Gemini API — серия Gemini 3; серия Gemini 2.0 Flash / Flash‑Lite полностью отключена, а модели 2.5 Pro / Flash / Flash‑Lite и часть медиа‑моделей имеют объявленные сроки вывода из эксплуатации и рассматриваются как переходные варианты с плановой миграцией на серию 3/3.5.

API поддерживает структурированный вывод, вызов функций, инструменты, управление компьютером через специализированную модель Computer Use и инструмент Computer Use в моделях серии Gemini 3, длинный контекст до 1 млн токенов, управление уровнем рассуждений через уровни рассуждений (рассуждений) и настройки media_resolution для мультимодального ввода, а также API реального времени (Gemini Live API) и собственные модели для создания изображений, видео и музыки (Nano Banana 2 / Pro, Veo 3.1, Lyria 3).

Обновлено 4 июня 2026 года.

Факты

Название	Google Gemini
Официальный сайт	deepmind.google
Документация	ai.google.dev/gemini-api/docs
Чат	gemini.google.com
Страна	США
Разработчик	Google / Google DeepMind
Доступ	API: документация Чат: веб‑клиент (бесплатный доступ и планы Google AI Plus / Pro / Ultra) Vertex AI: модели и возможности Google AI Studio: интерактивная среда

Быстрые ссылки

История релизов

2026-06 — Обновление линейки Gemini 3: на странице моделей выделены Gemini 3.1 Pro, Gemini 3.5 Flash, Gemini 3 Flash и Gemini 3.1 Flash‑Lite как основные модели; подтверждён статус серии 2.0 Flash / Flash‑Lite как «отключена» и вынесение их в блок Предыдущие модели.
2026-03-02 — Gemini 3.1 Flash‑Lite: анонс новой быстрой и бюджетной модели серии 3 с ценой $0.25 за 1M входных и $1.50 за 1M выходных токенов, 1M контекстом, улучшенным качеством относительно 2.5 Flash и поддержкой thinking‑уровней; сначала в превью, затем переведена в GA как gemini-3.1-flash-lite.
2026-03-09 — Вывод Gemini 3 Pro Preview: модель gemini-3-pro-preview перенесена в Предыдущие модели и отключена; рекомендован переход на gemini-3.1-pro (в API используется идентификатор gemini-3.1-pro / gemini-3.1-pro-preview в зависимости от среды).
2026-02–03 — Уточнение графика вывода 2.5 Flash / Pro: в документации и форуме разработчиков подтверждены планы по деактивации gemini-2.5-flash и gemini-2.5-pro летом–осенью 2026 года и указаны рекомендуемые преемники среди серии 3 (3.1 Flash‑Lite / 3 Flash / 3.5 Flash).
2026-01-26 — Google AI Plus: запуск более дешёвого плана с доступом к премиальным возможностям Gemini (включая 3‑ю серию и Nano Banana Pro) за $7.99/месяц в США и ряде стран, с акцией −50% первые два месяца.
2025-12–2025-11 — Выход Gemini 3 серии: Gemini 3 Pro и Gemini 3 Flash, а также режим Gemini 3 Deep Think; модели сфокусированы на усиленных рассуждениях, GPQA Diamond и SWE‑bench, с поддержкой режима рассуждений.
2025-10–12 — Линейка 2.5 (Pro / Flash / Flash‑Lite / Image / Computer Use) и ранние модели Live/TTS: запуск серии 2.5 как основного поколения до серии 3, с длинным контекстом 1 048 576 токенов и набором инструментов (Поиск, Карты, поиск по файлам, Computer Use, Live API, TTS); позже анонсирован график вывода моделей 2.5 в пользу 3‑й серии.

Модели (API)

ID (для API)	Тип / режим	Контекст	Кратко	Поддержка / ограничения	Цены ($/1 млн)	Документация
gemini-3.1-pro	Мультимодальная, рассуждающая (флагман серии 3)	~1 048 576 вход; ~65 536 выход	Передовая модель с усиленными многошаговыми рассуждениями, кодом и агентными сценариями; рекомендуемый преемник Gemini 3 Pro Preview и альтернатива 2.5 Pro для задач высокого класса.	Поддержка thinking / thinking‑levels (управляемая глубина рассуждений), media_resolution и Thought Signatures (сигнатуры мысли) для стабильного контекста рассуждений. Вызов функций, структурированный вывод, обоснование через Google Search и Карты, поиск по файлам, выполнение кода, контекст URL — полнофункциональный набор инструментов. Мультимодальность: текст, код, изображения, аудио, видео, PDF (входы), текст (выход).	по данным страницы цен: от ~$5–8 за 1M входных и ~$25–30 за 1M выходных токенов в зависимости от тарифа и региона (уточнять в актуальной таблице цен).	документация
gemini-3.5-flash	Мультимодальная, быстрая (3.5, рабочая)	~1 048 576 вход; ~65 536 выход	Новая быстрая модель серии 3.5 с передовым уровнем производительности для агентов и кода, позиционируется как «самая интеллектуальная модель для длительных агентных и кодовых задач» и используется как дефолтный «Auto»‑вариант во многих клиентах.	Поддерживает режим рассуждений, инструментальные вызовы, Search/Maps, Поиск по файлам, Live API и контекстное кэширование. Рекомендуется для агентов, сложного кода и долгих диалогов, где важны и качество, и скорость.	вход: $1.50; выход: $9.00 (включая thinking‑токены), в бесплатном слое — ограниченный объём использования.	документация
gemini-3-flash	Мультимодальная, быстрая (3, передовая)	~1 000 000 вход; ~65 536 выход	Быстрая модель Gemini 3 с производительностью уровня frontier при меньшей цене, чем у флагманских reasoning‑моделей; показывала 90.4% GPQA Diamond, 81.2% MMMU Pro и 78% SWE‑bench Verified в ранних релизах.	Поддержка функций, структурированного вывода, Search/Maps, Поиск по файлам, выполнения кода и URL‑контекста. Поддержка Computer Use (через специализированную модель и инструмент) для автоматизации браузера и интерфейсов. Подходит для чат‑ботов, суммаризации, кода и мультимодального анализа при жёстких ограничениях по задержке.	вход: порядка $0.50 за 1M токенов (текст/изображение/видео) и ~$1.00 за аудио; выход: ~$3.00 — ориентироваться на актуальную таблицу цен.	документация
gemini-3.1-flash-lite	Мультимодальная, экономичная (3.1, GA)	1 048 576 вход; 65 535 выход	Самая дешёвая и быстрая модель серии 3, оптимизированная для высокообъёмных, чувствительных к цене задач; по качеству стремится к 2.5 Flash и превосходит 2.5 Flash‑Lite, 2.0 Flash/Flash‑Lite по ключевым бенчмаркам.	Поддерживает Grounding (Search), выполнение кода, Supervised fine‑tuning, Continuous tuning, System instructions, Function calling, Structured output, Thinking, явное и неявное кэширование контекста. Не поддерживает Gemini Live API и ряд продвинутых функций наподобие Preference Tuning. GA‑версия `gemini-3.1-flash-lite` доступна с мая 2026; превью‑версия `gemini-3.1-flash-lite-preview` будет отключена 9 июля 2026.	вход: $0.25; выход: $1.50 за 1M токенов (серия 3 официально позиционирует эти цены в блоге).	документация
gemini-2.5-pro	Мультимодальная, рассуждающая (2.5, стабильная, планируется вывод)	~1 048 576 вход; ~65 536 выход	Флагман 2.5 для кода и сложных рассуждений; до появления 3‑й серии была основной «большой» моделью Google для сложных задач, сейчас рассматривается как стабильная база для продакшна с анонсированным графиком замены.	Полный набор инструментов (Search/Maps, Поиск по файлам, Code Execution, URL‑контекст, Structured output). Плановый вывод модели в рамках общей миграции с 2.5 на 3.x/3.5; рекомендуется закладывать переход на 3.1 Pro / 3.5 Flash.	типично: вход $1.25/$2.50 (≤/≥200k), выход $10/$15 за 1M — см. актуальную таблицу цен.	документация
gemini-2.5-flash	Мультимодальная, рассуждающая (2.5 Flash, планируется вывод)	1 048 576 вход; 65 536 выход	Бюджетная модель серии 2.5 с управляемым «мышлением» и хорошим балансом цены и качества; для новых проектов Google рекомендует мигрировать на 3 Flash / 3.1 Flash‑Lite.	Вызов функций, Structured output, Search/Maps, Поиск по файлам, Batch API, кэширование контекста. На странице deprecations указана дата плановой деактивации (осень 2026), что требует двухступенчатой миграции для команд, уходящих с 2.0 Flash на 2.5 Flash, а затем на 3.x.	ориентир: вход ~$0.30 (текст/изображения/видео) / ~$1.00 (аудио), выход ~$2.50 за 1M.	документация
gemini-2.5-flash-lite	Экономичная (2.5)	1 048 576 вход; 65 536 выход	Минимальная цена и задержка в серии 2.5; оптимизирована под высокие объёмы и простые задачи; помечена к выводу с переходом на 3.1 Flash‑Lite.	Инструменты и структурированный вывод поддерживаются, но для новых проектов рекомендуется 3.1 Flash‑Lite.	ориентир: вход ~$0.10 / выход ~$0.40 за 1M (проверять в актуальной таблице цен).	документация
nano-banana-2 (gemini-3.1-flash-image)	Генерация изображений (Nano Banana 2)	~65 536 вход; ~32 768 выход	Новое поколение встроенной генерации изображений с улучшенным рендерингом текста, до 4K, до 14 референсных изображений и поддержкой Обоснование через поиск (в том числе для поиска по изображениям).	Stable статус; рекомендуется как базовая модель для массовой генерации изображений вместо 2.5 Flash Image.	цены зависят от тарифов Gemini Media в таблице цен; обычно фиксированная цена за изображение.	документация
nano-banana-pro (gemini-3-pro-image)	Генерация изображений (Nano Banana Pro)	~65 536 вход; ~32 768 выход	Профессиональная модель изображений с reasoning‑ядром и поддержкой 4K, сложной вёрстки и аккуратного текста; используется в AI Plus / Pro / Ultra и в Google Flow.	Предназначена для студийного качества, креативных и брендовых материалов.	см. раздел Pricing: обычно выше, чем Nano Banana 2.	документация
veo-3.1 / veo-3.1-lite	Генерация видео	до нескольких минут видео (зависит от варианта)	Семейство Veo 3.1 — генерация видео с кинематографическим контролем, высокими разрешениями и синхронизированным аудио.	Доступно через Gemini API и Google Flow / AI Pro / Ultra; ориентировано на продакшн‑уровень видео.	цены зависят от длительности и разрешения, указаны в отдельной секции Video.	документация
computer-use	Автоматизация интерфейсов (Computer Use)	~128 000 вход; ~64 000 выход	Специализированная модель для управления экранами, браузером и UI‑элементами (клик, ввод текста, прокрутка и пр.), доступная как самостоятельная модель и как инструмент для моделей серии 3.	Предварительный доступ; требует строгих мер безопасности и ручных проверок действий.	тарификация близка к 2.5 Pro / 3 Pro в зависимости от конфигурации.	документация

Ключевые особенности

Развёртывание через Google AI Studio (Gemini API), Vertex AI и Gemini Enterprise Agent Platform; единая экосистема для разработчиков и корпоративных пользователей.
Режимы «мышления» и управляемые уровни рассуждений (thinking / thinking_level) в сериях 2.5, 3 и 3.5; Gemini 3 Deep Think и Deep Research / Deep Research Max как усиленные агентные режимы с увеличенным test‑time compute.
Вызов функций, структурированный вывод, инструменты и обоснование через Google Search и Карты, а также контекст URL и выполнение кода (Code Execution) во всех основных моделях текста/кода.
Поиск по файлам (Поиск по файлам) — встроенная система RAG с семантическим поиском и индексированием документов; есть лимиты по размеру/количеству объектов и отдельная тарификация за индексирование и хранение.
Управление компьютером (Computer Use) для автоматизации браузерных и, частично, настольных интерфейсов через отдельную модель и инструмент; интеграция в агентные сценарии с пошаговым контролем.
Собственные модели генерации изображений (Nano Banana / Nano Banana 2 / Pro), видео (Veo 3.1/3.1 Lite) и музыки (Lyria 3 Pro / Clip / RealTime) — доступны через те же учётные записи и биллинг.
Длинный контекст до 1M+ токенов для серий 2.5 и 3/3.5, с кэшированием контекста (implicit/explicit caching) и отдельной ценой за кэш‑хиты.
Gemini Live API для потоковых аудио‑ и мультимодальных взаимодействий (2.5 Flash Live, 3.1 Flash Live), с WebSocket‑интерфейсом для двунаправленного общения.
Batch API с заметной скидкой относительно стандартных запросов для асинхронной обработки, а также тарифы Provisioned Throughput / Pay‑as‑you‑go / Priority для крупных нагрузок.
Deep Research и Deep Research Max как отдельные агентные модели для многошагового сбора и синтеза информации с цитированием источников.

Ограничения и риски

Часть ключевых моделей (особенно новые версии 3.x/3.5 и Live/Deep Research/Antigravity‑агенты) имеет статус Preview или Experimental, что предполагает возможные изменения качества, цен, лимитов и интерфейсов API.
Снятие с эксплуатации 2.0 Flash / Flash‑Lite уже завершено, а 2.5 Flash / Pro / Flash‑Lite / часть медиа‑моделей имеют объявленные даты deprecation; это создаёт риск для систем, жёстко привязанных к устаревшим идентификаторам, и требует планирования миграций.
Поиск, Grounding и Поиск по файлам тарифицируются отдельно после базового бесплатного пакета; при активном использовании Search‑обоснований и Поиск по файлам нужно учитывать дополнительную стоимость.
Gemini Live API и Computer Use требуют отдельной конфигурации и строгих мер безопасности (особенно управление компьютером), включая поэтапное подтверждение действий и sandbox‑окружения.
Стоимость зависит не только от длины промпта и ответа, но и от уровня режима рассуждений и типов медиа (аудио, видео дороже текста/изображений); для высокоинтенсивных задач рекомендуется Batch API, Flex/Provisioned Throughput и контекстное кэширование.
Дата отсечения знаний для серии 3.1 Flash‑Lite и большинства моделей — январь 2025 года; для более свежих данных рекомендуется Обоснование через поиск или внешние источники.
Функции Deep Research, Deep Research Max, расширенная генерация видео (Veo 3.1) и режимы Deep Think/Omni доступны только или в первую очередь в платных планах Google AI Plus / Pro / Ultra, что влияет на доступность для конечных пользователей.

Сравнение цен

Чат (подписка)

Провайдер	План / уровень	Цена (USD)	Ссылка
Google	Google AI Plus	$7.99 / месяц в США (с 50% скидкой первые 2 месяца для новых подписчиков)	страница
Google	Google AI Pro	$19.99 / месяц; включает расширенные лимиты и, по новым условиям, YouTube Premium Lite в ряде стран.	страница
Google	Google AI Ultra ($100)	$100 / месяц (новый план с I/O 2026, 5× лимиты AI Pro, YouTube Premium, 20 TB хранилища и доступ к Gemini Spark).	страница
Google	Google AI Ultra ($200)	$200 / месяц (бывший топ‑тариф Ultra за $250, теперь пониженный до $200; 20× лимиты Pro и доступ к Project Genie).	страница
OpenAI	ChatGPT Plus	$20 / месяц	цены
Anthropic	Claude Pro	$20 / месяц	цены

API (модели)

Провайдер	Модель / ID	вход, $/1 млн	выход, $/1 млн	Примечания
Google	gemini-3.5-flash	$1.50	$9.00 (включая thinking‑токены)	Фронтир‑уровень для агентов и кода; отдельное кэширование контекста и Batch‑скидки.
Google	gemini-3.1-pro	ориентир ~$5–8 (по стандартным Pay‑as‑you‑go тарифам)	ориентир ~$25–30	Флагман reasoning; точные цены и региональные варианты — на странице цен.
Google	gemini-3-flash	~$0.50 (текст/изображения/видео), ~$1.00 (аудио)	~$3.00	Быстрая модель серии 3; конкретные значения зависят от тарифа (Standard / Flex / Batch).
Google	gemini-3.1-flash-lite	$0.25	$1.50	Самая дешёвая модель 3‑й серии; рекомендуется для высокообъёмных нагрузок вместо 2.5 Flash‑Lite.
Google	gemini-2.5-pro	$1.25 / $2.50 (≤/≥200k)	$10.00 / $15.00	Легаси‑флагман; планируется деактивация, рекомендован переход на 3.1 Pro.
Google	gemini-2.5-flash	~$0.30 (текст/изображения/видео), ~$1.00 (аудио)	~$2.50	Переходная модель; будет отключена в пользу 3.5 Flash.
Google	gemini-2.5-flash-lite	~$0.10	~$0.40	Экономичный вариант серии 2.5; для новых проектов лучше сразу 3.1 Flash‑Lite.
OpenAI	gpt-5	$1.25	$10.00	Флагман OpenAI по состоянию на 2026 год.
Anthropic	claude-sonnet-4.5	$3.00	$15.00	Сопоставим с 3.5 Flash / 3.1 Pro по классу задач.

Бенчмарки

Провайдер	Модель / ID	GPQA (Diamond)	Humanity’s Last Exam	MMMU Pro	SWE-bench Verified	Источник
Google	Gemini 3.1 Flash‑Lite	≈86.9%	не указано	≈76.8%	—	официально
Google	Gemini 3 Flash	≈90.4%	≈33.7%	≈81.2%	≈78%	официально
Google	Gemini 3 Deep Think	до ≈93–94% (в зависим. от режима)	≈48.4% (обновление 2026)	—	—	официально
Google	Gemini 2.5 Pro	≈83%	≈18.8%	≈81.7%	≈63.8%	официально
OpenAI	GPT-4o	~65–70%	~31–32%	—	—	агрегаторы и обзоры
Anthropic	Claude 3.5 Sonnet	67.2%	—	≈78–79%	—	официально

Обновления на июнь 2026

Serия Gemini 3.5 / 3.1 Flash‑Lite в фокусе: Google чётко позиционирует 3.5 Flash и 3.1 Pro как фронтирные модели для агентов и кода, а 3.1 Flash‑Lite — как самый дешёвый, но всё ещё «передового класса» вариант для высокообъёмных задач.
Полный вывод Gemini 2.0 Flash / Flash‑Lite: к 1 июня 2026 все идентификаторы 2.0 Flash и Flash‑Lite переведены в статус отключена, с прямой миграцией на 2.5 Flash / Flash‑Lite и анонсом последующей миграции на 3.5 Flash.
Плавный переход с 2.5 на 3.x: в документации и на форуме разработчиков указано, что текущие проекты на 2.5 Flash / Pro должны планировать миграцию на серию 3 до конца 2026 года, чтобы избежать двойного cut‑over за 4–5 месяцев.
Обновлённые AI‑подписки: Google AI Plus за $7.99, Pro за $19.99 и новые варианты Ultra за $100 и $200/месяц дают доступ к Gemini Omni, 3.5 Flash, 3.1 Pro, Nano Banana Pro, Veo 3.1, Deep Research и экспериментальному агенту Gemini Spark (Ultra).
Compute‑based лимиты: переход от дневных лимитов промптов к модели на основе потреблённого compute (особенно для Pro/Ultra), с пятичасовыми окнами обновления лимитов и возможностью докупать top‑up кредиты.