Факты
| Название | Google Gemini |
| Официальный сайт | deepmind.google |
| Документация | ai.google.dev/gemini-api/docs |
| Чат | gemini.google.com |
| Страна | США |
| Разработчик | Google / Google DeepMind |
| Доступ |
|
Быстрые ссылки
- Документация
- Модели и цены
- Вызов функций
- Инструмент поиска по файлам
- Computer Use (управление компьютером)
- Gemini Live API (реальное время)
- Модели в Vertex AI
- Статус
- Конфиденциальность
- Условия использования
История релизов
- 2026-03-09 — Отключение Gemini 3 Pro Preview в Gemini API и перенос модели в раздел предыдущих моделей (Previous models); рекомендован переход на
gemini-3.1-pro-preview— ссылка - 2026-02-12 — Обновление Gemini 3 Deep Think: объявлен новый рекорд на Humanity’s Last Exam (≈48.4%) и улучшения на других академических бенчмарках — ссылка
- 2026-01-29 — Инструмент управления компьютером для Gemini 3 Pro и Gemini 3 Flash: инструмент управления компьютером (Computer Use) официально поддерживается в
gemini-3-pro(через режимы в приложении) иgemini-3-flash-previewчерез инструментcomputer_useв Gemini API — ссылка - 2026-01-26 — Google AI Plus: более дешёвый план подписки с доступом к Gemini 3 Pro, функции глубокого исследования (Deep Research) и Nano Banana Pro в приложении Gemini — ссылка
- 2026-01-22 — Анонс вывода моделей Gemini 2.0 Flash и Flash-Lite из эксплуатации; в актуальной документации дата отключения перенесена на 1 июня 2026 года, рекомендован переход на Gemini 2.5 Flash и 2.5 Flash-Lite — ссылка
- 2026-01-03 — Агентное зрение (Agentic Vision) для Gemini 3 Flash: активное «исследующее» зрение для улучшения качества мультимодального восприятия — ссылка
- 2025-12-17 — Gemini 3 Flash: выпуск в статусе предварительного доступа (превью) на Vertex AI и Google AI Studio; 90.4% GPQA Diamond, 81.2% MMMU Pro, 78% SWE-bench Verified, в 3 раза быстрее, чем 2.5 Pro, и составляет менее четверти от стоимости Gemini 3 Pro — ссылка
- 2025-12-15 — Функция глубокого исследования (Gemini Deep Research) с визуальными отчётами — ссылка
- 2025-12-10 — Обновления синтеза речи: Gemini 2.5 Flash TTS и Gemini 2.5 Pro TTS в предварительном доступе — ссылка
- 2025-12-09 — Отключение Gemini 2.0 Flash Live и Gemini Live 2.5 Flash Preview — ссылка
- 2025-11-18 — Gemini 3.0 Pro: выпуск на Vertex AI, Google AI Studio и мобильное приложение Gemini — ссылка
- 2025-11-18 — Gemini 3 Deep Think: режим глубокого рассуждения для AI Ultra — ссылка
- 2025-11-05 — Инструмент поиска по файлам: публичный выпуск с бесплатным хранилищем и семантическим поиском — ссылка
- 2025-10-07 — Gemini 2.5 Computer Use (предварительный доступ): выпуск специализированной модели для автоматизации интерфейсов и браузера — ссылка
Модели (API)
| ID (для API) | Тип / режим | Контекст | Кратко | Поддержка / ограничения | Цены ($/1 млн) | Документация |
|---|---|---|---|---|---|---|
| gemini-3-flash-preview | Мультимодальная, быстрая (передовая) | 1 000 000 вход; 65 536 выход | Быстрая модель серии 3: 90.4% GPQA Diamond, 81.2% MMMU Pro, 78% SWE-bench Verified; ~3x быстрее 2.5 Pro при существенно более низкой цене. |
|
вход: $0.50 (текст/изображения/видео), $1.00 (аудио); выход: $3.00 | документация |
| gemini-3.1-pro-preview | Мультимодальная, рассуждающая (флагман серии 3) | 1 000 000 вход; 65 536 выход | Следующее поколение Gemini 3: улучшенные многошаговые рассуждения, код и агентные сценарии; 44.4% Humanity’s Last Exam и 94.3% GPQA Diamond в режиме высокого уровня размышлений (Thinking High). |
|
вход: $2.00 (≤200k) / $4.00 (>200k); выход: $12.00 (≤200k) / $18.00 (>200k) | документация |
| gemini-3.1-flash-lite-preview | Мультимодальная, экономичная (3.1), управляемое «мышление» | 1 000 000 вход; 65 536 выход | Рабочая лошадка серии 3: минимальная цена и задержка, поддержка thinking_level с профилем по умолчанию minimal; бесплатный уровень в Gemini API. |
|
вход: $0.25 (текст/изображения/видео), $0.50 (аудио); выход: $1.50 | документация |
| gemini-2.5-pro | Мультимодальная, рассуждающая | 1 048 576 вход; 65 536 выход | Флагман 2.5 для кода и сложных рассуждений; стабильная модель для рабочей среды (продакшена) с поддержкой длинного контекста. |
|
вход: $1.25 (≤200k) / $2.50 (>200k); выход: $10.00 (≤200k) / $15.00 (>200k) | документация |
| gemini-2.5-flash | Гибридные рассуждения (вкл/выкл) | 1 048 576 вход; 65 536 выход | Ускоренная 2.5 с управляемым «мышлением» и хорошим балансом качества, цены и скорости; основная модель для массовых задач. |
|
вход: $0.30 (текст/изображения/видео), $1.00 (аудио); выход: $2.50 | документация |
| gemini-2.5-flash-lite | Экономичная (2.5), рассуждающая | 1 048 576 вход; 65 536 выход | Минимальная цена и задержка в серии 2.5; для высоких объемов и периферийных вычислений, где важна цена. |
|
вход: $0.10 (текст/изображения/видео), $0.30 (аудио); выход: $0.40 | документация |
| gemini-2.5-flash-image | Собственный генератор изображений (Nano Banana) | 65 536 вход; 32 768 выход | Быстрый генератор и редактор изображений Nano Banana (Gemini 2.5 Flash Image); оптимизирован для высоких объемов и низкой задержки. |
|
вход: $0.30 (текст/изображение); выход: ≈$0.039 за изображение | документация |
| gemini-2.5-computer-use-preview-10-2025 | Автоматизация интерфейсов (Computer Use) | 128 000 вход; 64 000 выход | Специализированная модель на базе 2.5 Pro для управления веб-интерфейсами и браузерной автоматизации через инструмент Computer Use. |
|
вход: $1.25 (≤200k) / $2.50 (>200k); выход: $10.00 (≤200k) / $15.00 (>200k) | документация |
Ключевые особенности
- Развертывание через Google AI Studio (Gemini API) и Vertex AI; единая экосистема для разработчиков и корпоративных пользователей.
- Режимы «мышления» и управляемые уровни рассуждений (thinking_level) в сериях 2.5 и 3; Gemini 3 Deep Think как усиленный режим глубокого рассуждения для сложных задач.
- Вызов функций, структурированный вывод, инструменты и обоснование через Google Search и Карты, а также контекст URL и выполнение кода.
- Поиск по файлам — интегрированная система извлечения и расширения контекста с семантическим поиском и бесплатным хранилищем на старте.
- Управление компьютером (Computer Use) для автоматизации браузерных и частично мобильных интерфейсов, доступно как через специализированную модель 2.5, так и непосредственно в Gemini 3 Flash.
- Собственные модели генерации изображений: Gemini 2.5 Flash Image (Nano Banana), Gemini 3 Pro Image (Nano Banana Pro) и Gemini 3.1 Flash Image (Nano Banana 2).
- Собственные модели генерации видео (Veo 3, Veo 3.1 Fast) через Gemini API и подписки AI Pro / Ultra.
- Длинный контекст до 1 млн и более токенов во всех моделях 2.5 и 3; у 3-й серии — до 1 000 000 на входе и 64 тыс. на выходе.
- Gemini Live API для потоковых мультимодальных взаимодействий: аудиовывод, двунаправленный WebSocket, поддержка функций и моделей с рассуждением (Thinking).
- Кэширование контекста для оптимизации стоимости на длинных запросах, с отдельной тарификацией за хранение и считывание.
- Пакетный API (Batch) с примерно 50% скидкой для асинхронной обработки запросов.
- Глубокое исследование (Deep Research) с визуальными отчетами для подписчиков AI Ultra и расширенная функция глубокого исследования для AI Pro / Plus.
- Страница статуса и журнал инцидентов с гарантиями уровня обслуживания (SLA) для платных планов.
Рекомендации по применению
- Gemini 3 Flash — основная быстрая модель для продуктивных приложений, чат-ботов, агентных сценариев с управлением компьютером и мультимодального анализа при строгих ограничениях по цене и задержке.
- Gemini 3.1 Pro — передовые рассуждения, сложный анализ, программирование, автономные агенты и сценарии типа глубокого исследования (Deep Research); приоритетный выбор для задач, где важны качество и глубина вывода.
- Gemini 3 Deep Think — режим глубокого рассуждения для подписчиков AI Ultra (приложение и ограниченный доступ в API); задачи STEM, сложная математика, исследовательские сценарии с максимальным объемом вычислений во время тестирования (test-time compute).
- Gemini 3.1 Flash-Lite — высокообъемные сценарии, чувствительные к цене (чат, простая аналитика, классификация), где требуется серия 3, но минимальная стоимость.
- Gemini 2.5 Pro — альтернатива 3.1 Pro для рабочей среды (продакшена) для критичных нагрузок с уже отлаженным поведением; стоит учитывать объявленное снятие с эксплуатации к лету 2026 года и планировать переход.
- Gemini 2.5 Flash — основная рабочая модель для приложений с контролем цены и скорости: массовая суммаризация, чат, извлечение структурированных данных; хороша как переходный вариант перед переходом на Gemini 3 Flash.
- Gemini 2.5 Flash-Lite — высокообъемные сценарии (обработка логов, простые классификации), максимально чувствительные к цене; закладывать переход на Gemini 3.1 Flash-Lite к середине 2026 года.
- Gemini 2.5 Flash Image / Nano Banana — быстрая генерация и редактирование изображений, если не требуется максимальное качество и новые возможности 3-й серии Gemini; для новых проектов предпочтительнее Nano Banana 2 / Pro.
- Gemini 2.5 Computer Use — автоматизация интерфейсов и браузера, если нужен специализированный агент с устойчивым поведением и примером от Google; для новых разработок рекомендуется рассматривать инструмент управления компьютером в Gemini 3 Flash.
Ограничения и риски
- Все модели серии Gemini 3 (включая 3.1 Pro, 3 Flash, 3.1 Flash-Lite, 3 Pro Image и 3.1 Flash Image) находятся в статусе предварительного доступа (превью); возможны изменения качества, цен и интерфейсов API.
- Gemini 3 Deep Think остается режимом предварительного доступа для подписчиков AI Ultra и может иметь повышенную задержку и стоимость из-за увеличенного объема вычислений во время вывода (test-time compute).
- Обоснование через Google Search и Google Maps тарифицируется отдельно после бесплатного лимита (5 000 запросов в стандартном режиме, затем ~$14 за 1 000 запросов).
- API реального времени (Gemini Live API) требует использования WebSocket и отдельной конфигурации моделей Live / Flash Live.
- Поиск по файлам имеет ограничения по размеру хранилища и количеству индексируемых объектов; сверх лимита взимается плата за индексирование и хранение.
- Управление компьютером (Computer Use) остается функцией в предварительном доступе и требует дополнительных мер безопасности, в т.ч. пошаговых проверок действий и явного подтверждения критичных операций.
- Цены зависят от модели и типа тарифа (стандартный / пакетный), использования кэширования и обоснования; при планировании бюджета важно учитывать стоимость токенов рассуждения (thinking).
- Актуальность знаний моделей серии 2.5 и 3 — примерно январь 2025 года; для более свежих данных рекомендуется обоснование через Поиск (Search Grounding).
- Функция глубокого исследования (Deep Research), расширенная генерация видео (Veo 3 / 3.1) и режим Deep Think доступны только в платных планах Google AI Pro / Ultra.
- Модели серии Gemini 2.0 Flash и Flash-Lite помечены как устаревшие (Deprecated) и будут окончательно отключены 1 июня 2026 года; модели 2.5 Flash / Flash-Lite / Flash Image также имеют объявленные даты отключения летом–осенью 2026 года, поэтому новые проекты должны опираться на 3-ю серию.
Сравнение цен
Чат (подписка)
| Провайдер | План / уровень | Цена (USD) | Ссылка |
|---|---|---|---|
| Google AI Plus | $7.99 / месяц в США (акция −50% первые 2 месяца) | страница | |
| Google AI Pro | $19.99 / месяц | страница | |
| Google AI Ultra | $124.99 / 3 месяца (≈$41.66 / месяц) | страница | |
| OpenAI | ChatGPT Plus | $20 / месяц | цены |
| OpenAI | ChatGPT Pro | $200 / месяц | цены |
| Anthropic | Claude Pro | $20 / месяц | цены |
| Mistral | Le Chat Pro | ≈€14.99 / месяц | цены |
API (модели)
| Провайдер | Модель / ID | вход (≤200k), $/1 млн | вход (>200k), $/1 млн | выход, $/1 млн |
|---|---|---|---|---|
| gemini-3-flash-preview | $0.50 (текст/изображения/видео), $1.00 (аудио) | $0.50 (текст/изображения/видео), $1.00 (аудио) | $3.00 | |
| gemini-3.1-pro-preview | $2.00 | $4.00 | $12.00 / $18.00 | |
| gemini-2.5-pro | $1.25 | $2.50 | $10.00 / $15.00 | |
| gemini-2.5-flash | $0.30 (текст/изображения/видео), $1.00 (аудио) | $0.30 (текст/изображения/видео), $1.00 (аудио) | $2.50 | |
| gemini-2.5-flash-lite | $0.10 (текст/изображения/видео), $0.30 (аудио) | $0.10 (текст/изображения/видео), $0.30 (аудио) | $0.40 | |
| OpenAI | gpt-4o | $2.50 | $2.50 | $10.00 |
| Anthropic | claude-3.5-sonnet | $3.00 | $3.00 | $15.00 |
Бенчмарки
| Провайдер | Модель / ID | GPQA (Diamond) | Humanity’s Last Exam | MMMU Pro | SWE-bench Verified | Источник |
|---|---|---|---|---|---|---|
| Gemini 3 Deep Think | 93.8% | ≈48.4% (обновление 2026) | не указано | не указано | официально, обновление в LinkedIn | |
| Gemini 3.1 Pro | 94.3% | 44.4% | не указано | не указано | официально | |
| Gemini 3 Flash | 90.4% | 33.7% | 81.2% | 78% | официально | |
| Gemini 2.5 Pro | 83.0% | 18.8% | 81.7% | 63.8% | официально | |
| Gemini 2.5 Flash | 82.8% | не указано | не указано | не указано | официально | |
| OpenAI | GPT-4o | ~65.6% | ~31.6% | не указано | не указано | официально / сторонние обзоры |
| Anthropic | Claude 3.5 Sonnet | 67.2% | не указано | 78.7% | не указано | официально |
| xAI | Grok-4 | 87.5% | не указано | не указано | не указано | официально |
Обновления на март 2026
- Gemini 3.1 Pro Preview — новое поколение флагманской модели с улучшенными бенчмарками (94.3% GPQA Diamond, 44.4% Humanity’s Last Exam) и расширенным контролем параметров thinking_level / media_resolution.
- Gemini 3.1 Flash-Lite Preview — бюджетная модель серии 3 с поддержкой thinking_level и бесплатным уровнем (tier), рекомендованная для высокообъемных задач вместо 2.5 Flash-Lite.
- Gemini 3.1 Flash Image (Nano Banana 2) — новое поколение встроенной генерации изображений с улучшенным рендерингом текста, до 4K, 14 эталонными (референсными) изображениями и обоснованием (Grounding) через Google Search (включая поиск по изображениям).
- Gemini 3 Pro Image (Nano Banana Pro) — профессиональная модель для изображений с продвинутым рассуждением (Thinking) и поддержкой 4K для студийных визуальных материалов.
- Отключение Gemini 3 Pro Preview — модель перенесена в предыдущие модели (Previous models) и выключена 9 марта 2026 года; рекомендован переход на
gemini-3.1-pro-preview. - Снятие с эксплуатации 2.0 и 2.5 Flash-линейки — Gemini 2.0 Flash / Flash-Lite полностью помечены как устаревшие (Deprecated) с отключением 1 июня 2026 года, а 2.5 Flash / Flash-Lite / Flash Image — с датами отключения летом–осенью 2026 года, с рекомендуемыми моделями-преемниками в серии 3.
- Gemini 3 Deep Think — обновление февраля 2026 года с ростом результата на Humanity’s Last Exam до ≈48.4% и улучшениями в ряде сложных бенчмарков; режим доступен через AI Ultra.
- Gemini 2.5 Pro / Flash / Flash-Lite — обновленные карточки моделей с единым лимитом 1 048 576 входных и 65 536 выходных токенов и полным набором инструментов (Поиск, Карты, поиск по файлам, выполнение кода, рассуждение).
- Расширение Computer Use — помимо специализированной модели 2.5 Computer Use, поддержка инструмента управления компьютером официально добавлена в Gemini 3 Flash в Vertex AI и Gemini API.
- Уточненная тарификация — через официальную страницу цен Gemini API и сторонние калькуляторы подтверждены цены 2026 года для 3-й и 2.5-й серий, а также скидки пакетного API (≈50%).