Факты

Название Google Gemini
Официальный сайт deepmind.google
Документация ai.google.dev/gemini-api/docs
Чат gemini.google.com
Страна США
Разработчик Google / DeepMind
Доступы

Быстрые ссылки

История релизов

  • 2025-12-17 — Gemini 3 Flash: релиз в превью на Vertex AI и Google AI Studio; 90.4% GPQA Diamond, 81.2% MMMU Pro, 78% SWE-bench Verified, 3x быстрее чем 2.5 Pro, меньше четверти цены Gemini 3 Pro — ссылка
  • 2025-12-15 — Gemini Deep Research с визуальными отчетами: интегрированные диаграммы, графики и интерактивные симуляции для AI Ultra — ссылка
  • 2025-12-10 — Обновления текст-в-речь: Gemini 2.5 Flash TTS и Gemini 2.5 Pro TTS в превью с улучшенной выразительностью и естественностью — ссылка
  • 2025-12-09 — Отключение Gemini 2.0 Flash Live и Gemini Live 2.5 Flash Preview — ссылка
  • 2025-11-18 — Gemini 3.0 Pro: релиз на Vertex AI, Google AI Studio и мобильное приложение Gemini; передовые рассуждения и кодирование — ссылка
  • 2025-11-18 — Gemini 3 Deep Think: режим глубокого рассуждения для AI Ultra с 93.8% GPQA Diamond, 41.0% Humanity’s Last Exam (без инструментов) — ссылка
  • 2025-11-05 — Инструмент поиска по файлам: публичный релиз с бесплатным хранилищем и семантическим поиском; $0.15/1M за индексирование — ссылка
  • 2025-10-07 — Gemini 2.5 управление компьютером (превью): релиз для автоматизации интерфейсов и браузерной автоматизации — ссылка

Модели (API)

ID (для API) Тип / режим Контекст Кратко Поддержка / ограничения Цены ($/1M) Документация
gemini-3-flash-preview Мультимодальная, быстрая (передовая) 1,000,000 Быстрая альтернатива 3 Pro: 90.4% GPQA Diamond, 81.2% MMLU Pro, 78% SWE-bench, 3x быстрее 2.5 Pro, меньше четверти цены 3 Pro.
  • Превью (стабильная)
  • Вызов функций, Структурированный вывод, Обоснование
  • Поиск по файлам, API реального времени
  • Управление компьютером (в разработке)
вход: $0.50 (текст/изо/видео), $1.00 (аудио); выход: $3.00 документация
gemini-3-pro-preview Мультимодальная, рассуждающая (передовая) 1,048,576 Следующее поколение: улучшенное кодирование, мультимодальное понимание, агентные возможности, передовые рассуждения (37.5% Humanity’s Last Exam).
  • Превью на Vertex AI и Google AI Studio
  • Улучшено: кодирование, создание интерфейсов, многошаговые рассуждения
  • Вызов функций, Структурированный вывод, Обоснование, Поиск по файлам
  • Управление компьютером (в разработке)
вход: $2.00 (≤200k) / $4.00 (>200k); выход: $12.00 (≤200k) / $18.00 (>200k) документация
gemini-3-deep-think-preview Мультимодальная, глубокое рассуждение 1,000,000 Режим глубокого рассуждения для Gemini 3 Pro; лучшие показатели на Humanity’s Last Exam (41.0% без инструментов, 93.8% GPQA Diamond).
  • Превью (только подписчики AI Ultra)
  • Обновляется регулярно
  • Лучше в STEM и математике
в подписке AI Ultra документация
gemini-2.5-pro Мультимодальная, рассуждающая 1,048,576 вход; 65,535 выход Флагман 2.5 для кода и сложных рассуждений; стабильнее для продакшна.
  • Вызов функций, Структурированный вывод, Обоснование, Поиск по файлам
  • Кэширование контекста; Управление компьютером не поддерживается
  • GA, стабильна
вход: $1.25 (≤200k) / $2.50 (>200k); выход: $10.00 (≤200k) / $15.00 (>200k) документация
gemini-2.5-flash Гибридные рассуждения (вкл/выкл) до 1,000,000 Ускоренная 2.5 с управляемым «мышлением» и API реального времени; баланс качества и скорости.
  • Вызов функций, Обоснование, Поиск по файлам, API реального времени, Управление компьютером
  • 1M контекст; бюджеты на мышление
  • GA
вход: $0.30 (текст/изо/видео), $1.00 (аудио); выход: $2.50 документация
gemini-2.5-flash-lite Экономичная (2.5), рассуждающая до 1,000,000 Минимальная цена и задержка в 2.5 серии; для высоких объёмов и периферии.
  • Вызов функций, Обоснование, Поиск по файлам
  • 1M контекст; бюджеты на мышление
  • GA
вход: $0.10 (текст/изо/видео), $0.30 (аудио); выход: $0.40 документация
gemini-2.5-flash-image Собственный генератор изображений до 65,536 вход; 32,768 выход Встроенное создание и редактирование изображений для Flash; быстрый и гибкий.
  • Собственный генератор
  • GA
  • Быстрая генерация
вход: $0.30 (текст/изображение); выход: $0.039 за изображение документация
gemini-2.5-computer-use-preview-10-2025 Автоматизация интерфейсов (превью) до 1,000,000 Специализированная модель для управления интерфейсами и браузерной автоматизацией.
  • Инструмент управления компьютером
  • Веб и мобильные интерфейсы
  • Превью
вход: $1.25 (≤200k) / $2.50 (>200k); выход: $10.00 (≤200k) / $15.00 (>200k) документация
gemini-2.0-flash Мультимодальная (2.0) до 1,000,000 Сбалансированная мультимодальная модель 2.0; стабильная для продакшна.
  • Вызов функций, Обоснование, API реального времени
  • Кэширование контекста
  • GA
вход: $0.10 (текст/изо/видео), $0.70 (аудио); выход: $0.40 документация

Ключевые особенности

  • Развёртывание через Google AI Studio (Gemini API) и Vertex AI
  • Режимы «мышления» и управляемые бюджеты рассуждений в серии 2.5 и 3; Gemini 3 Deep Think для передовых рассуждений
  • Вызов функций, структурированный вывод, инструменты и обоснование через Google Search и Карты
  • Поиск по файлам — интегрированная система извлечения и увеличения поколения контекста с семантическим поиском, бесплатным хранилищем и встраиванием ($0.15/1M за индексирование)
  • Управление компьютером для автоматизации интерфейсов и браузерных задач (превью)
  • Собственные модели генерации изображений (Gemini 3 Pro Image, Gemini 2.5 Flash Image, Imagen 4)
  • Собственные модели генерации видео (Veo 3.1, Veo 3)
  • Длинный контекст до 1M+ токенов (зависит от модели)
  • API реального времени для потоковых мультимодальных взаимодействий (нативный аудиовывод)
  • Кэширование контекста для оптимизации стоимости на длинных контекстах
  • Пакетный API с 50% скидкой на асинхронную обработку
  • Deep Research с визуальными отчетами (диаграммы, графики, интерактивные симуляции) для AI Ultra
  • Страница статуса с журналом инцидентов и гарантиями уровня обслуживания

Рекомендации по применению

  • Gemini 3 Flash — быстрая альтернатива для продуктивных приложений, API реального времени, баланс качества и скорости, разработка
  • Gemini 3 Pro — кодинг нового уровня, передовые рассуждения, сложный анализ, агенты, готовность к продакшну
  • Gemini 3 Deep Think — STEM задачи, математика, очень сложные рассуждения (подписчики AI Ultra)
  • Gemini 2.5 Pro — кодинг, сложные рассуждения, анализ больших контекстов, альтернатива 3.0 для стабильности
  • Gemini 2.5 Flash — приложения с контролем цены/скорости, управление компьютером, баланс
  • Gemini 2.5 Flash-Lite — массовые, чувствительные к цене сценарии, высокие объёмы, периферийные вычисления
  • Gemini 2.5 Flash Image — встроенная генерация изображений с низкой задержкой
  • Gemini 2.0 Flash — стабильная альтернатива 2.5 для продакшна без рассуждений

Ограничения и риски

  • Gemini 3 Pro и Flash — новые модели, требуют пристального мониторинга в продакшне
  • Gemini 3 Deep Think в статусе превью — доступна только для подписчиков AI Ultra; возможны изменения
  • Обоснование через Google Search: $14/1000 запросов (начиная 5 января 2026)
  • API реального времени требует WebSocket и специальной конфигурации
  • Поиск по файлам: бесплатное хранилище 1–100 ГБ в зависимости от уровня; оптимально <20 ГБ
  • Управление компьютером (превью) — оптимизирован для браузеров, мобильная поддержка в разработке
  • Цены зависят от модели и могут меняться
  • Актуальность знаний: январь 2025 для текущих моделей
  • Deep Research с визуалами доступна только подписчикам AI Ultra

Сравнение цен

Чат (подписка)

Провайдер План / уровень Цена (USD) Ссылка
Google Google AI Pro $19.99 / месяц страница
Google Google AI Ultra $249.99 / месяц страница
OpenAI ChatGPT Plus $20 / месяц цены
OpenAI ChatGPT Pro $200 / месяц цены
Anthropic Claude Pro $20 / месяц цены
Mistral Le Chat Pro €19 / месяц цены

API (модели)

Провайдер Модель / ID вход (≤200k), $/1M вход (>200k), $/1M выход, $/1M
Google gemini-3-flash-preview $0.50 (текст/изо/видео) $0.50 $3.00
Google gemini-3-pro-preview $2.00 $4.00 $12.00 / $18.00
Google gemini-3-deep-think-preview в подписке AI Ultra в подписке AI Ultra в подписке AI Ultra
Google gemini-2.5-pro $1.25 $2.50 $10.00 / $15.00
Google gemini-2.5-flash $0.30 (текст/изо/видео) $0.30 $2.50
Google gemini-2.5-flash-lite $0.10 (текст/изо/видео) $0.10 $0.40
OpenAI gpt-4o $2.50 $2.50 $10.00
Anthropic claude-3.5-sonnet $3.00 $3.00 $15.00

Бенчмарки (официальные; декабрь 2025)

Провайдер Модель / ID GPQA (Diamond) Humanity’s Last Exam MMMU Pro SWE-bench Verified Источник
Google Gemini 3 Deep Think 93.8% 41.0% (без инструментов) не указано не указано официально
Google Gemini 3.0 Pro не указано 37.5% не указано не указано официально
Google Gemini 3 Flash 90.4% 33.7% (без инструментов) 81.2% 78% официально
Google Gemini 2.5 Pro 83.00% 18.8% (без инструментов) 81.7% 63.8% официально
Google Gemini 2.5 Flash 82.80% не указано не указано не указано официально
OpenAI GPT-4o 65.6% 31.6% не указано не указано официально
Anthropic Claude 3.5 Sonnet 67.20% не указано 78.7% не указано официально
xAI Grok-4 87.50% не указано не указано не указано официально

Обновления на декабрь 2025

  • Gemini 3 Flash (17 декабря) — новая быстрая модель с frontier-уровнем рассуждений: 90.4% GPQA Diamond, 81.2% MMMU Pro, 78% SWE-bench Verified, 3x быстрее чем Gemini 2.5 Pro, менее четверти цены Gemini 3 Pro ($0.50/$3.00 вход/выход); доступна в превью на Vertex AI и Google AI Studio
  • Gemini Deep Research с визуальными отчетами (15 декабря) — возможность генерировать интегрированные визуальные отчеты с диаграммами, графиками и интерактивными симуляциями; доступна только подписчикам AI Ultra
  • Gemini 3 Pro официально (18 ноября) — выпущена на Vertex AI, Google AI Studio и мобильном приложении; 37.5% Humanity’s Last Exam, передовые способности кодирования и рассуждений
  • Gemini 3 Deep Think (18 ноября) — режим глубокого рассуждения для Gemini 3 Pro; 93.8% GPQA Diamond, 41.0% Humanity’s Last Exam (без инструментов); только для подписчиков AI Ultra
  • Обновления текст-в-речь (10 декабря) — Gemini 2.5 Flash TTS и Pro TTS в превью с улучшенной выразительностью, естественностью и контролем темпа
  • Отключение моделей (9 декабря) — выведены из эксплуатации Gemini 2.0 Flash Live и Gemini Live 2.5 Flash Preview; требуется миграция на доступные модели
  • Кэширование контекста — доступно для всех основных моделей, значительно снижает стоимость для длинных контекстов (попадания 10x дешевле)
  • Пакетный API — 50% скидка на асинхронную обработку для всех моделей
  • Поиск по файлам — интегрированная система извлечения контекста с семантическим поиском, бесплатным хранилищем (1 ГБ–1 ТБ) и встраиванием ($0.15/1M)