Факты
| Название | Google Gemini |
| Официальный сайт | deepmind.google |
| Документация | ai.google.dev/gemini-api/docs |
| Чат | gemini.google.com |
| Страна | США |
| Разработчик | Google / DeepMind |
| Доступы |
|
Быстрые ссылки
- Документация
- Модели и цены
- Вызов функций
- Обоснование через Google Search
- Инструмент поиска по файлам
- Модели в Vertex AI
- Статус
- Конфиденциальность
- Условия использования
История релизов
- 2025-12-17 — Gemini 3 Flash: релиз в превью на Vertex AI и Google AI Studio; 90.4% GPQA Diamond, 81.2% MMMU Pro, 78% SWE-bench Verified, 3x быстрее чем 2.5 Pro, меньше четверти цены Gemini 3 Pro — ссылка
- 2025-12-15 — Gemini Deep Research с визуальными отчетами: интегрированные диаграммы, графики и интерактивные симуляции для AI Ultra — ссылка
- 2025-12-10 — Обновления текст-в-речь: Gemini 2.5 Flash TTS и Gemini 2.5 Pro TTS в превью с улучшенной выразительностью и естественностью — ссылка
- 2025-12-09 — Отключение Gemini 2.0 Flash Live и Gemini Live 2.5 Flash Preview — ссылка
- 2025-11-18 — Gemini 3.0 Pro: релиз на Vertex AI, Google AI Studio и мобильное приложение Gemini; передовые рассуждения и кодирование — ссылка
- 2025-11-18 — Gemini 3 Deep Think: режим глубокого рассуждения для AI Ultra с 93.8% GPQA Diamond, 41.0% Humanity’s Last Exam (без инструментов) — ссылка
- 2025-11-05 — Инструмент поиска по файлам: публичный релиз с бесплатным хранилищем и семантическим поиском; $0.15/1M за индексирование — ссылка
- 2025-10-07 — Gemini 2.5 управление компьютером (превью): релиз для автоматизации интерфейсов и браузерной автоматизации — ссылка
Модели (API)
| ID (для API) | Тип / режим | Контекст | Кратко | Поддержка / ограничения | Цены ($/1M) | Документация |
|---|---|---|---|---|---|---|
| gemini-3-flash-preview | Мультимодальная, быстрая (передовая) | 1,000,000 | Быстрая альтернатива 3 Pro: 90.4% GPQA Diamond, 81.2% MMLU Pro, 78% SWE-bench, 3x быстрее 2.5 Pro, меньше четверти цены 3 Pro. |
|
вход: $0.50 (текст/изо/видео), $1.00 (аудио); выход: $3.00 | документация |
| gemini-3-pro-preview | Мультимодальная, рассуждающая (передовая) | 1,048,576 | Следующее поколение: улучшенное кодирование, мультимодальное понимание, агентные возможности, передовые рассуждения (37.5% Humanity’s Last Exam). |
|
вход: $2.00 (≤200k) / $4.00 (>200k); выход: $12.00 (≤200k) / $18.00 (>200k) | документация |
| gemini-3-deep-think-preview | Мультимодальная, глубокое рассуждение | 1,000,000 | Режим глубокого рассуждения для Gemini 3 Pro; лучшие показатели на Humanity’s Last Exam (41.0% без инструментов, 93.8% GPQA Diamond). |
|
в подписке AI Ultra | документация |
| gemini-2.5-pro | Мультимодальная, рассуждающая | 1,048,576 вход; 65,535 выход | Флагман 2.5 для кода и сложных рассуждений; стабильнее для продакшна. |
|
вход: $1.25 (≤200k) / $2.50 (>200k); выход: $10.00 (≤200k) / $15.00 (>200k) | документация |
| gemini-2.5-flash | Гибридные рассуждения (вкл/выкл) | до 1,000,000 | Ускоренная 2.5 с управляемым «мышлением» и API реального времени; баланс качества и скорости. |
|
вход: $0.30 (текст/изо/видео), $1.00 (аудио); выход: $2.50 | документация |
| gemini-2.5-flash-lite | Экономичная (2.5), рассуждающая | до 1,000,000 | Минимальная цена и задержка в 2.5 серии; для высоких объёмов и периферии. |
|
вход: $0.10 (текст/изо/видео), $0.30 (аудио); выход: $0.40 | документация |
| gemini-2.5-flash-image | Собственный генератор изображений | до 65,536 вход; 32,768 выход | Встроенное создание и редактирование изображений для Flash; быстрый и гибкий. |
|
вход: $0.30 (текст/изображение); выход: $0.039 за изображение | документация |
| gemini-2.5-computer-use-preview-10-2025 | Автоматизация интерфейсов (превью) | до 1,000,000 | Специализированная модель для управления интерфейсами и браузерной автоматизацией. |
|
вход: $1.25 (≤200k) / $2.50 (>200k); выход: $10.00 (≤200k) / $15.00 (>200k) | документация |
| gemini-2.0-flash | Мультимодальная (2.0) | до 1,000,000 | Сбалансированная мультимодальная модель 2.0; стабильная для продакшна. |
|
вход: $0.10 (текст/изо/видео), $0.70 (аудио); выход: $0.40 | документация |
Ключевые особенности
- Развёртывание через Google AI Studio (Gemini API) и Vertex AI
- Режимы «мышления» и управляемые бюджеты рассуждений в серии 2.5 и 3; Gemini 3 Deep Think для передовых рассуждений
- Вызов функций, структурированный вывод, инструменты и обоснование через Google Search и Карты
- Поиск по файлам — интегрированная система извлечения и увеличения поколения контекста с семантическим поиском, бесплатным хранилищем и встраиванием ($0.15/1M за индексирование)
- Управление компьютером для автоматизации интерфейсов и браузерных задач (превью)
- Собственные модели генерации изображений (Gemini 3 Pro Image, Gemini 2.5 Flash Image, Imagen 4)
- Собственные модели генерации видео (Veo 3.1, Veo 3)
- Длинный контекст до 1M+ токенов (зависит от модели)
- API реального времени для потоковых мультимодальных взаимодействий (нативный аудиовывод)
- Кэширование контекста для оптимизации стоимости на длинных контекстах
- Пакетный API с 50% скидкой на асинхронную обработку
- Deep Research с визуальными отчетами (диаграммы, графики, интерактивные симуляции) для AI Ultra
- Страница статуса с журналом инцидентов и гарантиями уровня обслуживания
Рекомендации по применению
- Gemini 3 Flash — быстрая альтернатива для продуктивных приложений, API реального времени, баланс качества и скорости, разработка
- Gemini 3 Pro — кодинг нового уровня, передовые рассуждения, сложный анализ, агенты, готовность к продакшну
- Gemini 3 Deep Think — STEM задачи, математика, очень сложные рассуждения (подписчики AI Ultra)
- Gemini 2.5 Pro — кодинг, сложные рассуждения, анализ больших контекстов, альтернатива 3.0 для стабильности
- Gemini 2.5 Flash — приложения с контролем цены/скорости, управление компьютером, баланс
- Gemini 2.5 Flash-Lite — массовые, чувствительные к цене сценарии, высокие объёмы, периферийные вычисления
- Gemini 2.5 Flash Image — встроенная генерация изображений с низкой задержкой
- Gemini 2.0 Flash — стабильная альтернатива 2.5 для продакшна без рассуждений
Ограничения и риски
- Gemini 3 Pro и Flash — новые модели, требуют пристального мониторинга в продакшне
- Gemini 3 Deep Think в статусе превью — доступна только для подписчиков AI Ultra; возможны изменения
- Обоснование через Google Search: $14/1000 запросов (начиная 5 января 2026)
- API реального времени требует WebSocket и специальной конфигурации
- Поиск по файлам: бесплатное хранилище 1–100 ГБ в зависимости от уровня; оптимально <20 ГБ
- Управление компьютером (превью) — оптимизирован для браузеров, мобильная поддержка в разработке
- Цены зависят от модели и могут меняться
- Актуальность знаний: январь 2025 для текущих моделей
- Deep Research с визуалами доступна только подписчикам AI Ultra
Сравнение цен
Чат (подписка)
| Провайдер | План / уровень | Цена (USD) | Ссылка |
|---|---|---|---|
| Google AI Pro | $19.99 / месяц | страница | |
| Google AI Ultra | $249.99 / месяц | страница | |
| OpenAI | ChatGPT Plus | $20 / месяц | цены |
| OpenAI | ChatGPT Pro | $200 / месяц | цены |
| Anthropic | Claude Pro | $20 / месяц | цены |
| Mistral | Le Chat Pro | €19 / месяц | цены |
API (модели)
| Провайдер | Модель / ID | вход (≤200k), $/1M | вход (>200k), $/1M | выход, $/1M |
|---|---|---|---|---|
| gemini-3-flash-preview | $0.50 (текст/изо/видео) | $0.50 | $3.00 | |
| gemini-3-pro-preview | $2.00 | $4.00 | $12.00 / $18.00 | |
| gemini-3-deep-think-preview | в подписке AI Ultra | в подписке AI Ultra | в подписке AI Ultra | |
| gemini-2.5-pro | $1.25 | $2.50 | $10.00 / $15.00 | |
| gemini-2.5-flash | $0.30 (текст/изо/видео) | $0.30 | $2.50 | |
| gemini-2.5-flash-lite | $0.10 (текст/изо/видео) | $0.10 | $0.40 | |
| OpenAI | gpt-4o | $2.50 | $2.50 | $10.00 |
| Anthropic | claude-3.5-sonnet | $3.00 | $3.00 | $15.00 |
Бенчмарки (официальные; декабрь 2025)
| Провайдер | Модель / ID | GPQA (Diamond) | Humanity’s Last Exam | MMMU Pro | SWE-bench Verified | Источник |
|---|---|---|---|---|---|---|
| Gemini 3 Deep Think | 93.8% | 41.0% (без инструментов) | не указано | не указано | официально | |
| Gemini 3.0 Pro | не указано | 37.5% | не указано | не указано | официально | |
| Gemini 3 Flash | 90.4% | 33.7% (без инструментов) | 81.2% | 78% | официально | |
| Gemini 2.5 Pro | 83.00% | 18.8% (без инструментов) | 81.7% | 63.8% | официально | |
| Gemini 2.5 Flash | 82.80% | не указано | не указано | не указано | официально | |
| OpenAI | GPT-4o | 65.6% | 31.6% | не указано | не указано | официально |
| Anthropic | Claude 3.5 Sonnet | 67.20% | не указано | 78.7% | не указано | официально |
| xAI | Grok-4 | 87.50% | не указано | не указано | не указано | официально |
Обновления на декабрь 2025
- Gemini 3 Flash (17 декабря) — новая быстрая модель с frontier-уровнем рассуждений: 90.4% GPQA Diamond, 81.2% MMMU Pro, 78% SWE-bench Verified, 3x быстрее чем Gemini 2.5 Pro, менее четверти цены Gemini 3 Pro ($0.50/$3.00 вход/выход); доступна в превью на Vertex AI и Google AI Studio
- Gemini Deep Research с визуальными отчетами (15 декабря) — возможность генерировать интегрированные визуальные отчеты с диаграммами, графиками и интерактивными симуляциями; доступна только подписчикам AI Ultra
- Gemini 3 Pro официально (18 ноября) — выпущена на Vertex AI, Google AI Studio и мобильном приложении; 37.5% Humanity’s Last Exam, передовые способности кодирования и рассуждений
- Gemini 3 Deep Think (18 ноября) — режим глубокого рассуждения для Gemini 3 Pro; 93.8% GPQA Diamond, 41.0% Humanity’s Last Exam (без инструментов); только для подписчиков AI Ultra
- Обновления текст-в-речь (10 декабря) — Gemini 2.5 Flash TTS и Pro TTS в превью с улучшенной выразительностью, естественностью и контролем темпа
- Отключение моделей (9 декабря) — выведены из эксплуатации Gemini 2.0 Flash Live и Gemini Live 2.5 Flash Preview; требуется миграция на доступные модели
- Кэширование контекста — доступно для всех основных моделей, значительно снижает стоимость для длинных контекстов (попадания 10x дешевле)
- Пакетный API — 50% скидка на асинхронную обработку для всех моделей
- Поиск по файлам — интегрированная система извлечения контекста с семантическим поиском, бесплатным хранилищем (1 ГБ–1 ТБ) и встраиванием ($0.15/1M)