Факты

Название Google Gemini
Официальный сайт deepmind.google
Документация ai.google.dev/gemini-api/docs
Чат gemini.google.com
Страна / HQ не указано
Разработчик Google (Google LLC)
Доступы

Быстрые ссылки

История релизов

  • 2025-07-22 — Gemini 2.5 Flash-Lite: GA (стабильная) — ссылка
  • 2025-06-17 — Расширение семейства 2.5 (Flash-Lite Preview) — ссылка
  • 2025-05-20 — Обновления 2.5 и анонс Deep Think — ссылка
  • 2025-04-17 — Запуск Gemini 2.5 Flash (Preview) — ссылка

Модели (API)

ID (для API) Тип / режим Контекст Кратко Поддержка / ограничения Цены ($/1M) Документация
gemini-2.5-pro Мультимодальная, reasoning 1,048,576 input; 65,535 output Флагман 2.5 для кода и сложных рассуждений.
  • Function calling, Structured outputs, Grounding
  • Контекст-кэширование; Live API — не указано
in (hit): —; in (miss): $1.25 (≤200k) / $2.50 (>200k); out: $10.00 (≤200k) / $15.00 (>200k) документация
gemini-2.5-flash Гибридный reasoning (вкл/выкл) до 1,000,000 Ускоренная 2.5 с управляемым «thinking».
  • Function calling, Grounding, Live API
  • 1M контекст; thinking-бюджеты
in (hit): —; in (miss): $0.30 (text/img/video), $1.00 (audio); out: $2.50 документация
gemini-2.5-flash-lite Экономичная (2.5), reasoning до 1,000,000 Минимальная цена и латентность в 2.5 серии.
  • Function calling, Grounding
  • 1M контекст; thinking-бюджеты
in (hit): —; in (miss): $0.10 (text/img/video), $0.30 (audio); out: $0.40 документация
gemini-2.0-flash Мультимодальная (2.0) до 1,000,000 Сбалансированная мультимодальная модель 2.0.
  • Function calling, Grounding, Live API
  • Кэширование контекста
in (hit): —; in (miss): $0.10 (text/img/video), $0.70 (audio); out: $0.40 документация

Ключевые особенности

  • Развёртывание через Google AI Studio (Gemini API) и Vertex AI
  • «Thinking»-режим и управляемые бюджеты рассуждений в серии 2.5
  • Function calling, Structured outputs, инструменты и Grounding with Google Search
  • Длинный контекст до 1M–1,048,576 токенов (модель-зависимо)
  • Live API для потоковых мультимодальных взаимодействий
  • Страница статуса с журналом инцидентов

Рекомендации по применению

  • 2.5 Pro — кодинг, сложные рассуждения, агенты
  • 2.5 Flash — продуктивные приложения с контролем цены/скорости и Live API
  • 2.5 Flash-Lite — массовые, чувствительные к цене и задержке сценарии

Ограничения и риски

  • Часть возможностей тарифицируется отдельно (Grounding с Google Search)
  • Цены и лимиты зависят от модели/тарифа и могут меняться
  • Некоторые модели и режимы доступны как Preview / GA — проверяйте карточки моделей

Сравнение цен

Чат (подписка)

Провайдер План / уровень Цена (как в оф. источнике) Ссылка
Google Google AI Pro $19.99 / месяц страница
Google Google AI Ultra $249.99 / месяц страница
OpenAI ChatGPT Plus $20 / месяц прайсинг
Anthropic Claude Pro $20 / месяц (или $17/мес при годовой оплате) прайсинг
Mistral Le Chat Pro €19 / месяц прайсинг

API (модели)

Провайдер Модель / ID in (hit), $/1M in (miss), $/1M out, $/1M Ссылка
Google gemini-2.5-pro $1.25 (≤200k) / $2.50 (>200k) $10.00 (≤200k) / $15.00 (>200k) прайсинг
Google gemini-2.5-flash $0.30 (text/img/video) / $1.00 (audio) $2.50 прайсинг
OpenAI gpt-5 $0.125 (cached) $1.25 $10.00 прайсинг
xAI grok-4-0709 $0.75 (cached) $3.00 $15.00 прайсинг
Anthropic claude-opus-4.1 $3.00 (input ≤200k) $15.00 (output ≤200k) прайсинг
Mistral devstral-medium-2507 $0.40 $2.00 прайсинг (новость)

Бенчмарки (официальные)

Провайдер Модель / ID GPQA (Diamond) MMLU MMLU Pro DROP (F1) HumanEval (pass@1) Источник
Google Gemini 2.5 Pro 83.00% не указано не указано не указано не указано официально
Google Gemini 2.5 Flash 82.80% не указано не указано не указано не указано официально
Google Gemini 2.5 Flash-Lite 64.60% не указано не указано не указано не указано официально
OpenAI GPT-5 85.70% 92.50% не указано не указано 93.40% официально
OpenAI GPT-4.1 66.30% 90.20% не указано не указано не указано официально
OpenAI GPT-4o mini 40.20% 82.00% не указано 79.70% 87.20% официально
xAI Grok-4 Heavy 88.40% не указано не указано не указано не указано официально
xAI Grok-4 87.50% не указано не указано не указано не указано официально
xAI Grok-3 84.60% не указано не указано не указано не указано официально
Anthropic Claude Opus 4.1 80.90% не указано не указано не указано не указано официально
Anthropic Claude 3.7 Sonnet 84.80% не указано не указано не указано не указано официально
Anthropic Claude 3.5 Sonnet 67.20% 90.40% 77.60% 87.10% 93.70% официально
DeepSeek DeepSeek-R1-0528 81.00% не указано 85.00% не указано не указано официально
DeepSeek DeepSeek-V3 59.10% 88.50% 75.90% 91.60% не указано официально
Mistral Devstral Medium не указано не указано не указано не указано не указано не указано
Mistral Devstral Small 1.1 не указано не указано не указано не указано не указано не указано
Meta Llama 3.1 405B Instruct 50.7% 87.3% 73.3% 84.8% 89.0% официально
Meta Llama 3.1 70B Instruct 41.70% 83.60% 66.40% 79.60% 80.50% официально
Alibaba Qwen2.5 72B Instruct 49.00% не указано 71.10% не указано 86.60% не указано
Alibaba Qwen2.5 32B Instruct 49.50% 83.30% 69.00% не указано 88.40% не указано
AI21 Jamba 1.5 Large 36.90% 81.20% 53.50% не указано не указано официально
Microsoft Phi 4 56.10% 84.80% 70.40% 75.50% 82.60% официально