Факты
| Название | Google Gemini |
| Официальный сайт | deepmind.google |
| Документация | ai.google.dev/gemini-api/docs |
| Чат | gemini.google.com |
| Страна | США |
| Разработчик | Google / Google DeepMind |
| Доступ |
|
Быстрые ссылки
- Документация
- Модели и цены
- Вызов функций
- Инструмент поиска по файлам
- Управление компьютером
- Gemini Live API (реальное время)
- Модели в Vertex AI
- Статус
- Конфиденциальность
- Условия использования
История релизов
- 2026-06 — Обновление линейки Gemini 3: на странице моделей выделены Gemini 3.1 Pro, Gemini 3.5 Flash, Gemini 3 Flash и Gemini 3.1 Flash‑Lite как основные модели; подтверждён статус серии 2.0 Flash / Flash‑Lite как «отключена» и вынесение их в блок Предыдущие модели.
- 2026-03-02 — Gemini 3.1 Flash‑Lite: анонс новой быстрой и бюджетной модели серии 3 с ценой $0.25 за 1M входных и $1.50 за 1M выходных токенов, 1M контекстом, улучшенным качеством относительно 2.5 Flash и поддержкой thinking‑уровней; сначала в превью, затем переведена в GA как
gemini-3.1-flash-lite. - 2026-03-09 — Вывод Gemini 3 Pro Preview: модель
gemini-3-pro-previewперенесена в Предыдущие модели и отключена; рекомендован переход наgemini-3.1-pro(в API используется идентификаторgemini-3.1-pro/gemini-3.1-pro-previewв зависимости от среды). - 2026-02–03 — Уточнение графика вывода 2.5 Flash / Pro: в документации и форуме разработчиков подтверждены планы по деактивации
gemini-2.5-flashиgemini-2.5-proлетом–осенью 2026 года и указаны рекомендуемые преемники среди серии 3 (3.1 Flash‑Lite / 3 Flash / 3.5 Flash). - 2026-01-26 — Google AI Plus: запуск более дешёвого плана с доступом к премиальным возможностям Gemini (включая 3‑ю серию и Nano Banana Pro) за $7.99/месяц в США и ряде стран, с акцией −50% первые два месяца.
- 2025-12–2025-11 — Выход Gemini 3 серии: Gemini 3 Pro и Gemini 3 Flash, а также режим Gemini 3 Deep Think; модели сфокусированы на усиленных рассуждениях, GPQA Diamond и SWE‑bench, с поддержкой режима рассуждений.
- 2025-10–12 — Линейка 2.5 (Pro / Flash / Flash‑Lite / Image / Computer Use) и ранние модели Live/TTS: запуск серии 2.5 как основного поколения до серии 3, с длинным контекстом 1 048 576 токенов и набором инструментов (Поиск, Карты, поиск по файлам, Computer Use, Live API, TTS); позже анонсирован график вывода моделей 2.5 в пользу 3‑й серии.
Модели (API)
| ID (для API) | Тип / режим | Контекст | Кратко | Поддержка / ограничения | Цены ($/1 млн) | Документация |
|---|---|---|---|---|---|---|
| gemini-3.1-pro | Мультимодальная, рассуждающая (флагман серии 3) | ~1 048 576 вход; ~65 536 выход | Передовая модель с усиленными многошаговыми рассуждениями, кодом и агентными сценариями; рекомендуемый преемник Gemini 3 Pro Preview и альтернатива 2.5 Pro для задач высокого класса. |
|
по данным страницы цен: от ~$5–8 за 1M входных и ~$25–30 за 1M выходных токенов в зависимости от тарифа и региона (уточнять в актуальной таблице цен). | документация |
| gemini-3.5-flash | Мультимодальная, быстрая (3.5, рабочая) | ~1 048 576 вход; ~65 536 выход | Новая быстрая модель серии 3.5 с передовым уровнем производительности для агентов и кода, позиционируется как «самая интеллектуальная модель для длительных агентных и кодовых задач» и используется как дефолтный «Auto»‑вариант во многих клиентах. |
|
вход: $1.50; выход: $9.00 (включая thinking‑токены), в бесплатном слое — ограниченный объём использования. | документация |
| gemini-3-flash | Мультимодальная, быстрая (3, передовая) | ~1 000 000 вход; ~65 536 выход | Быстрая модель Gemini 3 с производительностью уровня frontier при меньшей цене, чем у флагманских reasoning‑моделей; показывала 90.4% GPQA Diamond, 81.2% MMMU Pro и 78% SWE‑bench Verified в ранних релизах. |
|
вход: порядка $0.50 за 1M токенов (текст/изображение/видео) и ~$1.00 за аудио; выход: ~$3.00 — ориентироваться на актуальную таблицу цен. | документация |
| gemini-3.1-flash-lite | Мультимодальная, экономичная (3.1, GA) | 1 048 576 вход; 65 535 выход | Самая дешёвая и быстрая модель серии 3, оптимизированная для высокообъёмных, чувствительных к цене задач; по качеству стремится к 2.5 Flash и превосходит 2.5 Flash‑Lite, 2.0 Flash/Flash‑Lite по ключевым бенчмаркам. |
|
вход: $0.25; выход: $1.50 за 1M токенов (серия 3 официально позиционирует эти цены в блоге). | документация |
| gemini-2.5-pro | Мультимодальная, рассуждающая (2.5, стабильная, планируется вывод) | ~1 048 576 вход; ~65 536 выход | Флагман 2.5 для кода и сложных рассуждений; до появления 3‑й серии была основной «большой» моделью Google для сложных задач, сейчас рассматривается как стабильная база для продакшна с анонсированным графиком замены. |
|
типично: вход $1.25/$2.50 (≤/≥200k), выход $10/$15 за 1M — см. актуальную таблицу цен. | документация |
| gemini-2.5-flash | Мультимодальная, рассуждающая (2.5 Flash, планируется вывод) | 1 048 576 вход; 65 536 выход | Бюджетная модель серии 2.5 с управляемым «мышлением» и хорошим балансом цены и качества; для новых проектов Google рекомендует мигрировать на 3 Flash / 3.1 Flash‑Lite. |
|
ориентир: вход ~$0.30 (текст/изображения/видео) / ~$1.00 (аудио), выход ~$2.50 за 1M. | документация |
| gemini-2.5-flash-lite | Экономичная (2.5) | 1 048 576 вход; 65 536 выход | Минимальная цена и задержка в серии 2.5; оптимизирована под высокие объёмы и простые задачи; помечена к выводу с переходом на 3.1 Flash‑Lite. |
|
ориентир: вход ~$0.10 / выход ~$0.40 за 1M (проверять в актуальной таблице цен). | документация |
| nano-banana-2 (gemini-3.1-flash-image) | Генерация изображений (Nano Banana 2) | ~65 536 вход; ~32 768 выход | Новое поколение встроенной генерации изображений с улучшенным рендерингом текста, до 4K, до 14 референсных изображений и поддержкой Обоснование через поиск (в том числе для поиска по изображениям). |
|
цены зависят от тарифов Gemini Media в таблице цен; обычно фиксированная цена за изображение. | документация |
| nano-banana-pro (gemini-3-pro-image) | Генерация изображений (Nano Banana Pro) | ~65 536 вход; ~32 768 выход | Профессиональная модель изображений с reasoning‑ядром и поддержкой 4K, сложной вёрстки и аккуратного текста; используется в AI Plus / Pro / Ultra и в Google Flow. |
|
см. раздел Pricing: обычно выше, чем Nano Banana 2. | документация |
| veo-3.1 / veo-3.1-lite | Генерация видео | до нескольких минут видео (зависит от варианта) | Семейство Veo 3.1 — генерация видео с кинематографическим контролем, высокими разрешениями и синхронизированным аудио. |
|
цены зависят от длительности и разрешения, указаны в отдельной секции Video. | документация |
| computer-use | Автоматизация интерфейсов (Computer Use) | ~128 000 вход; ~64 000 выход | Специализированная модель для управления экранами, браузером и UI‑элементами (клик, ввод текста, прокрутка и пр.), доступная как самостоятельная модель и как инструмент для моделей серии 3. |
|
тарификация близка к 2.5 Pro / 3 Pro в зависимости от конфигурации. | документация |
Ключевые особенности
- Развёртывание через Google AI Studio (Gemini API), Vertex AI и Gemini Enterprise Agent Platform; единая экосистема для разработчиков и корпоративных пользователей.
- Режимы «мышления» и управляемые уровни рассуждений (thinking / thinking_level) в сериях 2.5, 3 и 3.5; Gemini 3 Deep Think и Deep Research / Deep Research Max как усиленные агентные режимы с увеличенным test‑time compute.
- Вызов функций, структурированный вывод, инструменты и обоснование через Google Search и Карты, а также контекст URL и выполнение кода (Code Execution) во всех основных моделях текста/кода.
- Поиск по файлам (Поиск по файлам) — встроенная система RAG с семантическим поиском и индексированием документов; есть лимиты по размеру/количеству объектов и отдельная тарификация за индексирование и хранение.
- Управление компьютером (Computer Use) для автоматизации браузерных и, частично, настольных интерфейсов через отдельную модель и инструмент; интеграция в агентные сценарии с пошаговым контролем.
- Собственные модели генерации изображений (Nano Banana / Nano Banana 2 / Pro), видео (Veo 3.1/3.1 Lite) и музыки (Lyria 3 Pro / Clip / RealTime) — доступны через те же учётные записи и биллинг.
- Длинный контекст до 1M+ токенов для серий 2.5 и 3/3.5, с кэшированием контекста (implicit/explicit caching) и отдельной ценой за кэш‑хиты.
- Gemini Live API для потоковых аудио‑ и мультимодальных взаимодействий (2.5 Flash Live, 3.1 Flash Live), с WebSocket‑интерфейсом для двунаправленного общения.
- Batch API с заметной скидкой относительно стандартных запросов для асинхронной обработки, а также тарифы Provisioned Throughput / Pay‑as‑you‑go / Priority для крупных нагрузок.
- Deep Research и Deep Research Max как отдельные агентные модели для многошагового сбора и синтеза информации с цитированием источников.
Рекомендации по применению
- Gemini 3.5 Flash — основной выбор для сложных агентов, код‑ассистентов и пользовательских приложений, где нужны и качество frontier‑уровня, и приемлемая цена; особенно если используются подписки AI Plus / Pro / Ultra или платный API.
- Gemini 3.1 Pro — сложные рассуждения, анализ, программирование, автономные агенты и сценарии типа Deep Research; лучше подходит там, где важнее качество reasoning, чем абсолютная скорость и стоимость.
- Gemini 3 Flash — быстрые чат‑боты, суммаризация, коды и мультимодальные сценарии с ограниченным бюджетом; хорош якобы как промежуточная ступень между 3.1 Flash‑Lite и 3.5 Flash.
- Gemini 3.1 Flash‑Lite — высокообъёмные, чувствительные к цене сценарии (чат, модерация, простая аналитика, массовая обработка мультимодальных запросов), где важны низкая цена и скорость, но всё ещё нужен уровень качества серии 3.
- Gemini 2.5 Pro / Flash / Flash‑Lite — легаси‑модели для существующих продакшн‑нагрузок; при проектировании новых систем стоит сразу планировать миграцию на серию 3.x/3.5, учитывая объявленные даты деактивации.
- Gemini 3‑серия медиа (Nano Banana 2 / Pro, Veo 3.1) — генерация изображений/видео профессионального уровня; Nano Banana 2 — для массовой генерации, Pro — для студийного качества, Veo 3.1 — для сложной работы с видео.
- Computer Use — автоматизация браузера и UI в связке с Gemini 3/3.5; рекомендуется только при чётких ограничениях и в «песочнице» из‑за высокого риска влияния на реальные аккаунты и данные.
Ограничения и риски
- Часть ключевых моделей (особенно новые версии 3.x/3.5 и Live/Deep Research/Antigravity‑агенты) имеет статус Preview или Experimental, что предполагает возможные изменения качества, цен, лимитов и интерфейсов API.
- Снятие с эксплуатации 2.0 Flash / Flash‑Lite уже завершено, а 2.5 Flash / Pro / Flash‑Lite / часть медиа‑моделей имеют объявленные даты deprecation; это создаёт риск для систем, жёстко привязанных к устаревшим идентификаторам, и требует планирования миграций.
- Поиск, Grounding и Поиск по файлам тарифицируются отдельно после базового бесплатного пакета; при активном использовании Search‑обоснований и Поиск по файлам нужно учитывать дополнительную стоимость.
- Gemini Live API и Computer Use требуют отдельной конфигурации и строгих мер безопасности (особенно управление компьютером), включая поэтапное подтверждение действий и sandbox‑окружения.
- Стоимость зависит не только от длины промпта и ответа, но и от уровня режима рассуждений и типов медиа (аудио, видео дороже текста/изображений); для высокоинтенсивных задач рекомендуется Batch API, Flex/Provisioned Throughput и контекстное кэширование.
- Дата отсечения знаний для серии 3.1 Flash‑Lite и большинства моделей — январь 2025 года; для более свежих данных рекомендуется Обоснование через поиск или внешние источники.
- Функции Deep Research, Deep Research Max, расширенная генерация видео (Veo 3.1) и режимы Deep Think/Omni доступны только или в первую очередь в платных планах Google AI Plus / Pro / Ultra, что влияет на доступность для конечных пользователей.
Сравнение цен
Чат (подписка)
| Провайдер | План / уровень | Цена (USD) | Ссылка |
|---|---|---|---|
| Google AI Plus | $7.99 / месяц в США (с 50% скидкой первые 2 месяца для новых подписчиков) | страница | |
| Google AI Pro | $19.99 / месяц; включает расширенные лимиты и, по новым условиям, YouTube Premium Lite в ряде стран. | страница | |
| Google AI Ultra ($100) | $100 / месяц (новый план с I/O 2026, 5× лимиты AI Pro, YouTube Premium, 20 TB хранилища и доступ к Gemini Spark). | страница | |
| Google AI Ultra ($200) | $200 / месяц (бывший топ‑тариф Ultra за $250, теперь пониженный до $200; 20× лимиты Pro и доступ к Project Genie). | страница | |
| OpenAI | ChatGPT Plus | $20 / месяц | цены |
| Anthropic | Claude Pro | $20 / месяц | цены |
API (модели)
| Провайдер | Модель / ID | вход, $/1 млн | выход, $/1 млн | Примечания |
|---|---|---|---|---|
| gemini-3.5-flash | $1.50 | $9.00 (включая thinking‑токены) | Фронтир‑уровень для агентов и кода; отдельное кэширование контекста и Batch‑скидки. | |
| gemini-3.1-pro | ориентир ~$5–8 (по стандартным Pay‑as‑you‑go тарифам) | ориентир ~$25–30 | Флагман reasoning; точные цены и региональные варианты — на странице цен. | |
| gemini-3-flash | ~$0.50 (текст/изображения/видео), ~$1.00 (аудио) | ~$3.00 | Быстрая модель серии 3; конкретные значения зависят от тарифа (Standard / Flex / Batch). | |
| gemini-3.1-flash-lite | $0.25 | $1.50 | Самая дешёвая модель 3‑й серии; рекомендуется для высокообъёмных нагрузок вместо 2.5 Flash‑Lite. | |
| gemini-2.5-pro | $1.25 / $2.50 (≤/≥200k) | $10.00 / $15.00 | Легаси‑флагман; планируется деактивация, рекомендован переход на 3.1 Pro. | |
| gemini-2.5-flash | ~$0.30 (текст/изображения/видео), ~$1.00 (аудио) | ~$2.50 | Переходная модель; будет отключена в пользу 3.5 Flash. | |
| gemini-2.5-flash-lite | ~$0.10 | ~$0.40 | Экономичный вариант серии 2.5; для новых проектов лучше сразу 3.1 Flash‑Lite. | |
| OpenAI | gpt-5 | $1.25 | $10.00 | Флагман OpenAI по состоянию на 2026 год. |
| Anthropic | claude-sonnet-4.5 | $3.00 | $15.00 | Сопоставим с 3.5 Flash / 3.1 Pro по классу задач. |
Бенчмарки
| Провайдер | Модель / ID | GPQA (Diamond) | Humanity’s Last Exam | MMMU Pro | SWE-bench Verified | Источник |
|---|---|---|---|---|---|---|
| Gemini 3.1 Flash‑Lite | ≈86.9% | не указано | ≈76.8% | — | официально | |
| Gemini 3 Flash | ≈90.4% | ≈33.7% | ≈81.2% | ≈78% | официально | |
| Gemini 3 Deep Think | до ≈93–94% (в зависим. от режима) | ≈48.4% (обновление 2026) | — | — | официально | |
| Gemini 2.5 Pro | ≈83% | ≈18.8% | ≈81.7% | ≈63.8% | официально | |
| OpenAI | GPT-4o | ~65–70% | ~31–32% | — | — | агрегаторы и обзоры |
| Anthropic | Claude 3.5 Sonnet | 67.2% | — | ≈78–79% | — | официально |
Обновления на июнь 2026
- Serия Gemini 3.5 / 3.1 Flash‑Lite в фокусе: Google чётко позиционирует 3.5 Flash и 3.1 Pro как фронтирные модели для агентов и кода, а 3.1 Flash‑Lite — как самый дешёвый, но всё ещё «передового класса» вариант для высокообъёмных задач.
- Полный вывод Gemini 2.0 Flash / Flash‑Lite: к 1 июня 2026 все идентификаторы 2.0 Flash и Flash‑Lite переведены в статус отключена, с прямой миграцией на 2.5 Flash / Flash‑Lite и анонсом последующей миграции на 3.5 Flash.
- Плавный переход с 2.5 на 3.x: в документации и на форуме разработчиков указано, что текущие проекты на 2.5 Flash / Pro должны планировать миграцию на серию 3 до конца 2026 года, чтобы избежать двойного cut‑over за 4–5 месяцев.
- Обновлённые AI‑подписки: Google AI Plus за $7.99, Pro за $19.99 и новые варианты Ultra за $100 и $200/месяц дают доступ к Gemini Omni, 3.5 Flash, 3.1 Pro, Nano Banana Pro, Veo 3.1, Deep Research и экспериментальному агенту Gemini Spark (Ultra).
- Compute‑based лимиты: переход от дневных лимитов промптов к модели на основе потреблённого compute (особенно для Pro/Ultra), с пятичасовыми окнами обновления лимитов и возможностью докупать top‑up кредиты.