Факты

Название Google Gemini
Официальный сайт deepmind.google
Документация ai.google.dev/gemini-api/docs
Чат gemini.google.com
Страна США
Разработчик Google / DeepMind
Доступы

Быстрые ссылки

История релизов

  • 2025-11-18 — Gemini 3.0 Pro: релиз на Vertex AI, Google AI Studio и мобильное приложение Gemini; передовые рассуждения и кодирование — ссылка
  • 2025-11-18 — Gemini 3 Deep Think: режим для AI Ultra с 93.8% GPQA Diamond, 45.1% ARC-AGI (с выполнением кода) — ссылка
  • 2025-11-05 — Инструмент поиска по файлам: публичный релиз с бесплатным хранилищем и семантическим поиском; $0.15/1M за индексирование — ссылка
  • 2025-10-07 — Gemini 2.5 Управление компьютером (Preview): релиз для автоматизации интерфейсов и браузерной автоматизации — ссылка
  • 2025-10-02 — Gemini 2.5 Flash Image GA: собственный генератор изображений на базе Gemini 2.5 — ссылка
  • 2025-07-22 — Gemini 2.5 Flash-Lite: общедоступная версия (GA) с ценой $0.10 вход / $0.40 выход — ссылка
  • 2025-06-17 — Gemini 2.5 Pro: GA с адаптивным режимом мышления — ссылка

Модели (API)

ID (для API) Тип / режим Контекст Кратко Поддержка / ограничения Цены ($/1M) Документация
gemini-3-pro Мультимодальная, рассуждающая (передовая) 1,000,000 Следующее поколение: улучшенное кодирование (SVG +30% vs конкуренты), мультимодальное понимание, агентные возможности, передовые рассуждения.
  • GA (стабильная) на Vertex AI и Google AI Studio
  • Улучшено: SVG-код, создание интерфейсов, многошаговые рассуждения, длинный контекст
  • Поиск по файлам, Вызов функций, Структурированный вывод, Управление компьютером
  • Цены будут объявлены (TBA)
будет объявлено документация
gemini-3-deep-think-preview Мультимодальная, глубокое рассуждение (Превью) 1,000,000 Режим глубокого рассуждения для Gemini 3 Pro; лучшие показатели на Humanity’s Last Exam (41.0% без инструментов) и GPQA Diamond (93.8%).
  • Превью (только для подписчиков AI Ultra)
  • Обновляется регулярно
  • Лучше в STEM и математике
будет объявлено (в подписке AI Ultra) документация
gemini-2.5-pro Мультимодальная, рассуждающая 1,048,576 вход; 65,535 выход Флагман 2.5 для кода и сложных рассуждений; стабильнее чем 3.0 для продакшна.
  • Вызов функций, Структурированный вывод, Обоснование, Поиск по файлам
  • Кэширование контекста; Управление компьютером не поддерживается
  • GA, стабильна
вход: $1.25 (≤200k) / $2.50 (>200k); выход: $10.00 (≤200k) / $15.00 (>200k) документация
gemini-2.5-flash Гибридные рассуждения (вкл/выкл) до 1,000,000 Ускоренная 2.5 с управляемым «мышлением» и API реального времени; баланс качества и скорости.
  • Вызов функций, Обоснование, Поиск по файлам, API реального времени, Управление компьютером
  • 1M контекст; бюджеты на мышление
  • GA
вход: $0.30 (текст/изо/видео), $1.00 (аудио); выход: $2.50 документация
gemini-2.5-flash-lite Экономичная (2.5), рассуждающая до 1,000,000 Минимальная цена и задержка в 2.5 серии; для высоких объёмов и периферии.
  • Вызов функций, Обоснование, Поиск по файлам
  • 1M контекст; бюджеты на мышление
  • GA
вход: $0.10 (текст/изо/видео), $0.30 (аудио); выход: $0.40 документация
gemini-2.5-flash-image Собственный генератор изображений до 65,536 вход; 32,768 выход Встроенное создание и редактирование изображений для Flash; быстрый и гибкий.
  • Собственный генератор
  • GA
  • Быстрая генерация
вход: $0.30 (текст/изображение); выход: $0.039 за изображение (1-100 в мин) документация
gemini-2.5-computer-use-preview-10-2025 Автоматизация интерфейсов (Превью) до 1,000,000 Специализированная модель для управления интерфейсами и браузерной автоматизацией; веб и мобильные интерфейсы.
  • Инструмент Управления компьютером
  • Веб и мобильные интерфейсы
  • Превью
вход: $1.25 (≤200k) / $2.50 (>200k); выход: $10.00 (≤200k) / $15.00 (>200k) документация
gemini-2.0-flash Мультимодальная (2.0) до 1,000,000 Сбалансированная мультимодальная модель 2.0; более стабильная чем 2.5 для продакшна без рассуждений.
  • Вызов функций, Обоснование, API реального времени
  • Кэширование контекста
  • GA
вход: $0.10 (текст/изо/видео), $0.70 (аудио); выход: $0.40 документация

Ключевые особенности

  • Развёртывание через Google AI Studio (Gemini API) и Vertex AI
  • Режим «мышления» и управляемые бюджеты рассуждений в серии 2.5; Gemini 3 Deep Think для передовых рассуждений
  • Вызов функций, Структурированный вывод, инструменты и Обоснование через Google Search / Google Maps
  • Поиск по файлам — интегрированная RAG с семантическим поиском, бесплатным хранилищем и встраиванием ($0.15/1M за индексирование)
  • Управление компьютером для автоматизации интерфейсов и браузерных задач
  • Собственные модели генерации изображений (Gemini 2.5 Flash Image, Imagen 3)
  • Собственные модели генерации видео (Veo, Veo 2)
  • Длинный контекст до 1M токенов (зависит от модели)
  • API реального времени для потоковых мультимодальных взаимодействий (нативный аудиовывод 24 кГц)
  • Кэширование контекста для оптимизации стоимости на длинных контекстах
  • Пакетный API с 50% скидкой на обработку асинхронных запросов
  • Страница статуса с журналом инцидентов и SLA

Рекомендации по применению

  • Gemini 3.0 Pro — кодинг нового уровня (SVG +30%), передовые рассуждения, сложный анализ, агенты, готовность к продакшну
  • Gemini 3 Deep Think — STEM задачи, математика, очень сложные рассуждения (подписчики AI Ultra)
  • Gemini 2.5 Pro — кодинг, сложные рассуждения, анализ больших контекстов, альтернатива 3.0 для стабильности
  • Gemini 2.5 Flash — продуктивные приложения с контролем цены/скорости, API реального времени, Управление компьютером для автоматизации, баланс
  • Gemini 2.5 Flash-Lite — массовые, чувствительные к цене и задержке сценарии, обработка высоких объёмов, периферийные вычисления
  • Gemini 2.5 Flash Image — встроенная генерация изображений с меньшей задержкой
  • Gemini 2.0 Flash — более стабильная альтернатива 2.5 для продакшна, если нужна надёжность без рассуждений

Ограничения и риски

  • Gemini 3.0 Pro — новая модель, требует пристального мониторинга в продакшне; возможны побочные эффекты
  • Gemini 3 Deep Think в статусе Превью — доступна только для подписчиков AI Ultra; возможны изменения
  • Некоторые возможности тарифицируются отдельно (Google Search: $35/1000 запросов после бесплатного лимита)
  • API реального времени требует WebSocket и специальной конфигурации, поддерживается не всеми моделями
  • Поиск по файлам: бесплатное хранилище до 1 ГБ (Free), 10 ГБ (Уровень 1), 100 ГБ (Уровень 2), 1 ТБ (Уровень 3); оптимальный размер хранилища <20 ГБ
  • Управление компьютером (Превью) — оптимизирован для браузеров, мобильная поддержка в разработке
  • Цены и лимиты зависят от модели/тарифа и могут меняться (сентябрь 2025 видел увеличение на Flash)
  • Актуальность знаний: декабрь 2024 для текущих моделей (может отличаться)
  • Gemini 2.0 Flash Live будет выведена из эксплуатации 9 декабря 2025; требуется миграция

Сравнение цен

Чат (подписка)

Провайдер План / уровень Цена (как в оф. источнике) Ссылка
Google Google AI Pro $19.99 / месяц страница
Google Google AI Ultra $249.99 / месяц страница
OpenAI ChatGPT Plus $20 / месяц цены
OpenAI ChatGPT Pro $200 / месяц цены
Anthropic Claude Pro $20 / месяц цены
Anthropic Claude Max $100 или $200 / месяц цены
xAI SuperGrok $300 / год цены
xAI SuperGrok Heavy $300 / месяц цены
Mistral Le Chat Pro €19 / месяц цены

API (модели)

Провайдер Модель / ID вход (попадание), $/1M вход (промах), $/1M выход, $/1M Ссылка
Google gemini-3-pro будет объявлено (кэширование доступно) будет объявлено будет объявлено GA, цены скоро
Google gemini-3-deep-think-preview будет объявлено будет объявлено будет объявлено Превью (только AI Ultra)
Google gemini-2.5-pro $0.125 (кэш) $1.25 (≤200k) / $2.50 (>200k) $10.00 (≤200k) / $15.00 (>200k) цены
Google gemini-2.5-flash $0.03 (кэш) $0.30 (текст/изо/видео) / $1.00 (аудио) $2.50 цены
Google gemini-2.5-flash-lite $0.01 (кэш) $0.10 (текст/изо/видео) / $0.30 (аудио) $0.40 цены
OpenAI gpt-5 $0.125 (кэш) $1.25 $10.00 цены
OpenAI gpt-4o $1.25 (кэш) $2.50 $10.00 цены
xAI grok-4-0709 $0.75 (кэш) $3.00 $15.00 цены
xAI grok-4-heavy будет объявлено будет объявлено будет объявлено цены
Anthropic claude-3.7-sonnet $0.30 (кэш) $3.00 $15.00 цены
Anthropic claude-3.5-sonnet $0.30 (кэш) $3.00 $15.00 цены
DeepSeek deepseek-r1 будет объявлено будет объявлено API в разработке
Mistral devstral-medium-2507 $0.40 $2.00 цены
Meta Llama 3.1 405B (через API) бесплатно (открытые веса) или $2.50+ (API) бесплатно (открытые веса) или $7.50+ (API) ссылка

Бенчмарки (официальные; ноябрь 2025)

Провайдер Модель / ID GPQA (Diamond) MMLU MMLU Pro HumanEval (pass@1) ARC-AGI (с вып. кода) Источник
Google Gemini 3 Deep Think 93.8% не указано не указано не указано не указано официально
Google Gemini 3.0 Pro не указано не указано не указано не указано 45.1% (с вып. кода) официально
Google Gemini 2.5 Pro 83.00% не указано не указано не указано не указано официально
Google Gemini 2.5 Flash 82.80% не указано не указано не указано не указано официально
Google Gemini 2.5 Flash-Lite 64.60% не указано не указано не указано не указано официально
OpenAI GPT-5 85.70% 92.50% не указано 93.40% не указано официально
OpenAI GPT-4o mini 40.20% 82.00% не указано 87.20% не указано официально
xAI Grok-4 Heavy 88.40% не указано не указано не указано не указано официально
xAI Grok-4 87.50% не указано не указано не указано не указано официально
Anthropic Claude 3.7 Sonnet 85.00% не указано не указано не указано не указано официально
Anthropic Claude 3.5 Sonnet 67.20% 90.40% 77.60% 93.70% не указано официально
DeepSeek DeepSeek-R1-0528 81.00% не указано 85.00% не указано не указано официально
DeepSeek DeepSeek-V3 59.10% 88.50% 75.90% не указано не указано официально
Meta Llama 3.1 405B Instruct 50.7% 87.3% 73.3% 89.0% не указано официально
Meta Llama 3.1 70B Instruct 41.70% 83.60% 66.40% 80.50% не указано официально
Alibaba Qwen2.5 72B Instruct 49.00% не указано 71.10% 86.60% не указано не указано
Alibaba Qwen2.5 32B Instruct 49.50% 83.30% 69.00% 88.40% не указано не указано
AI21 Jamba 1.5 Large 36.90% 81.20% 53.50% не указано не указано официально
Microsoft Phi 4 56.10% 84.80% 70.40% 82.60% не указано официально

Обновления на декабрь 2025

  • Gemini 3.0 Pro GA (18 ноября) — запущена на Vertex AI, Google AI Studio и мобильное приложение Gemini; передовые рассуждения, генерация SVG-кода (+30% vs конкуренты), кодирование, многоходовые агентные задачи
  • Gemini 3 Deep Think Превью — режим глубокого рассуждения для Gemini 3 Pro; 93.8% GPQA Diamond, 41.0% Humanity’s Last Exam; только для подписчиков AI Ultra
  • Инструмент поиска по файлам GA — интегрированная RAG система с семантическим поиском, бесплатным хранилищем (1 ГБ–1 ТБ в зависимости от уровня), автоматическим разбиением (чанкингом); стоимость $0.15/1M за индексирование
  • Пакетный API — асинхронная обработка с 50% скидкой (доступна для всех моделей)
  • Кэширование контекста — кэширование для оптимизации стоимости на длинных запросах (попадания в кэш дешевле в 10 раз)
  • Gemini 2.0 Flash Live устарела — будет выведена из эксплуатации 9 декабря 2025; рекомендуется переход на gemini-2.5-flash-native-audio-preview-09-2025 или gemini-2.5-flash
  • Обновления цен — Gemini 3.0 Pro цены будут объявлены; Gemini 2.5 Flash-Lite остаётся самым доступным ($0.10 вход / $0.40 выход); кэширование контекста доступно для Pro и Flash