Факты
| Название | Google Gemini |
| Официальный сайт | deepmind.google |
| Документация | ai.google.dev/gemini-api/docs |
| Чат | gemini.google.com |
| Страна | США |
| Разработчик | Google / DeepMind |
| Доступы |
|
Быстрые ссылки
- Документация
- Модели и цены
- Вызов функций
- Обоснование через Google Search
- Инструмент поиска по файлам
- Модели в Vertex AI
- Статус
- Конфиденциальность
- Условия использования
История релизов
- 2025-11-18 — Gemini 3.0 Pro: релиз на Vertex AI, Google AI Studio и мобильное приложение Gemini; передовые рассуждения и кодирование — ссылка
- 2025-11-18 — Gemini 3 Deep Think: режим для AI Ultra с 93.8% GPQA Diamond, 45.1% ARC-AGI (с выполнением кода) — ссылка
- 2025-11-05 — Инструмент поиска по файлам: публичный релиз с бесплатным хранилищем и семантическим поиском; $0.15/1M за индексирование — ссылка
- 2025-10-07 — Gemini 2.5 Управление компьютером (Preview): релиз для автоматизации интерфейсов и браузерной автоматизации — ссылка
- 2025-10-02 — Gemini 2.5 Flash Image GA: собственный генератор изображений на базе Gemini 2.5 — ссылка
- 2025-07-22 — Gemini 2.5 Flash-Lite: общедоступная версия (GA) с ценой $0.10 вход / $0.40 выход — ссылка
- 2025-06-17 — Gemini 2.5 Pro: GA с адаптивным режимом мышления — ссылка
Модели (API)
| ID (для API) | Тип / режим | Контекст | Кратко | Поддержка / ограничения | Цены ($/1M) | Документация |
|---|---|---|---|---|---|---|
| gemini-3-pro | Мультимодальная, рассуждающая (передовая) | 1,000,000 | Следующее поколение: улучшенное кодирование (SVG +30% vs конкуренты), мультимодальное понимание, агентные возможности, передовые рассуждения. |
|
будет объявлено | документация |
| gemini-3-deep-think-preview | Мультимодальная, глубокое рассуждение (Превью) | 1,000,000 | Режим глубокого рассуждения для Gemini 3 Pro; лучшие показатели на Humanity’s Last Exam (41.0% без инструментов) и GPQA Diamond (93.8%). |
|
будет объявлено (в подписке AI Ultra) | документация |
| gemini-2.5-pro | Мультимодальная, рассуждающая | 1,048,576 вход; 65,535 выход | Флагман 2.5 для кода и сложных рассуждений; стабильнее чем 3.0 для продакшна. |
|
вход: $1.25 (≤200k) / $2.50 (>200k); выход: $10.00 (≤200k) / $15.00 (>200k) | документация |
| gemini-2.5-flash | Гибридные рассуждения (вкл/выкл) | до 1,000,000 | Ускоренная 2.5 с управляемым «мышлением» и API реального времени; баланс качества и скорости. |
|
вход: $0.30 (текст/изо/видео), $1.00 (аудио); выход: $2.50 | документация |
| gemini-2.5-flash-lite | Экономичная (2.5), рассуждающая | до 1,000,000 | Минимальная цена и задержка в 2.5 серии; для высоких объёмов и периферии. |
|
вход: $0.10 (текст/изо/видео), $0.30 (аудио); выход: $0.40 | документация |
| gemini-2.5-flash-image | Собственный генератор изображений | до 65,536 вход; 32,768 выход | Встроенное создание и редактирование изображений для Flash; быстрый и гибкий. |
|
вход: $0.30 (текст/изображение); выход: $0.039 за изображение (1-100 в мин) | документация |
| gemini-2.5-computer-use-preview-10-2025 | Автоматизация интерфейсов (Превью) | до 1,000,000 | Специализированная модель для управления интерфейсами и браузерной автоматизацией; веб и мобильные интерфейсы. |
|
вход: $1.25 (≤200k) / $2.50 (>200k); выход: $10.00 (≤200k) / $15.00 (>200k) | документация |
| gemini-2.0-flash | Мультимодальная (2.0) | до 1,000,000 | Сбалансированная мультимодальная модель 2.0; более стабильная чем 2.5 для продакшна без рассуждений. |
|
вход: $0.10 (текст/изо/видео), $0.70 (аудио); выход: $0.40 | документация |
Ключевые особенности
- Развёртывание через Google AI Studio (Gemini API) и Vertex AI
- Режим «мышления» и управляемые бюджеты рассуждений в серии 2.5; Gemini 3 Deep Think для передовых рассуждений
- Вызов функций, Структурированный вывод, инструменты и Обоснование через Google Search / Google Maps
- Поиск по файлам — интегрированная RAG с семантическим поиском, бесплатным хранилищем и встраиванием ($0.15/1M за индексирование)
- Управление компьютером для автоматизации интерфейсов и браузерных задач
- Собственные модели генерации изображений (Gemini 2.5 Flash Image, Imagen 3)
- Собственные модели генерации видео (Veo, Veo 2)
- Длинный контекст до 1M токенов (зависит от модели)
- API реального времени для потоковых мультимодальных взаимодействий (нативный аудиовывод 24 кГц)
- Кэширование контекста для оптимизации стоимости на длинных контекстах
- Пакетный API с 50% скидкой на обработку асинхронных запросов
- Страница статуса с журналом инцидентов и SLA
Рекомендации по применению
- Gemini 3.0 Pro — кодинг нового уровня (SVG +30%), передовые рассуждения, сложный анализ, агенты, готовность к продакшну
- Gemini 3 Deep Think — STEM задачи, математика, очень сложные рассуждения (подписчики AI Ultra)
- Gemini 2.5 Pro — кодинг, сложные рассуждения, анализ больших контекстов, альтернатива 3.0 для стабильности
- Gemini 2.5 Flash — продуктивные приложения с контролем цены/скорости, API реального времени, Управление компьютером для автоматизации, баланс
- Gemini 2.5 Flash-Lite — массовые, чувствительные к цене и задержке сценарии, обработка высоких объёмов, периферийные вычисления
- Gemini 2.5 Flash Image — встроенная генерация изображений с меньшей задержкой
- Gemini 2.0 Flash — более стабильная альтернатива 2.5 для продакшна, если нужна надёжность без рассуждений
Ограничения и риски
- Gemini 3.0 Pro — новая модель, требует пристального мониторинга в продакшне; возможны побочные эффекты
- Gemini 3 Deep Think в статусе Превью — доступна только для подписчиков AI Ultra; возможны изменения
- Некоторые возможности тарифицируются отдельно (Google Search: $35/1000 запросов после бесплатного лимита)
- API реального времени требует WebSocket и специальной конфигурации, поддерживается не всеми моделями
- Поиск по файлам: бесплатное хранилище до 1 ГБ (Free), 10 ГБ (Уровень 1), 100 ГБ (Уровень 2), 1 ТБ (Уровень 3); оптимальный размер хранилища <20 ГБ
- Управление компьютером (Превью) — оптимизирован для браузеров, мобильная поддержка в разработке
- Цены и лимиты зависят от модели/тарифа и могут меняться (сентябрь 2025 видел увеличение на Flash)
- Актуальность знаний: декабрь 2024 для текущих моделей (может отличаться)
- Gemini 2.0 Flash Live будет выведена из эксплуатации 9 декабря 2025; требуется миграция
Сравнение цен
Чат (подписка)
| Провайдер | План / уровень | Цена (как в оф. источнике) | Ссылка |
|---|---|---|---|
| Google AI Pro | $19.99 / месяц | страница | |
| Google AI Ultra | $249.99 / месяц | страница | |
| OpenAI | ChatGPT Plus | $20 / месяц | цены |
| OpenAI | ChatGPT Pro | $200 / месяц | цены |
| Anthropic | Claude Pro | $20 / месяц | цены |
| Anthropic | Claude Max | $100 или $200 / месяц | цены |
| xAI | SuperGrok | $300 / год | цены |
| xAI | SuperGrok Heavy | $300 / месяц | цены |
| Mistral | Le Chat Pro | €19 / месяц | цены |
API (модели)
| Провайдер | Модель / ID | вход (попадание), $/1M | вход (промах), $/1M | выход, $/1M | Ссылка |
|---|---|---|---|---|---|
| gemini-3-pro | будет объявлено (кэширование доступно) | будет объявлено | будет объявлено | GA, цены скоро | |
| gemini-3-deep-think-preview | будет объявлено | будет объявлено | будет объявлено | Превью (только AI Ultra) | |
| gemini-2.5-pro | $0.125 (кэш) | $1.25 (≤200k) / $2.50 (>200k) | $10.00 (≤200k) / $15.00 (>200k) | цены | |
| gemini-2.5-flash | $0.03 (кэш) | $0.30 (текст/изо/видео) / $1.00 (аудио) | $2.50 | цены | |
| gemini-2.5-flash-lite | $0.01 (кэш) | $0.10 (текст/изо/видео) / $0.30 (аудио) | $0.40 | цены | |
| OpenAI | gpt-5 | $0.125 (кэш) | $1.25 | $10.00 | цены |
| OpenAI | gpt-4o | $1.25 (кэш) | $2.50 | $10.00 | цены |
| xAI | grok-4-0709 | $0.75 (кэш) | $3.00 | $15.00 | цены |
| xAI | grok-4-heavy | будет объявлено | будет объявлено | будет объявлено | цены |
| Anthropic | claude-3.7-sonnet | $0.30 (кэш) | $3.00 | $15.00 | цены |
| Anthropic | claude-3.5-sonnet | $0.30 (кэш) | $3.00 | $15.00 | цены |
| DeepSeek | deepseek-r1 | — | будет объявлено | будет объявлено | API в разработке |
| Mistral | devstral-medium-2507 | — | $0.40 | $2.00 | цены |
| Meta | Llama 3.1 405B (через API) | — | бесплатно (открытые веса) или $2.50+ (API) | бесплатно (открытые веса) или $7.50+ (API) | ссылка |
Бенчмарки (официальные; ноябрь 2025)
| Провайдер | Модель / ID | GPQA (Diamond) | MMLU | MMLU Pro | HumanEval (pass@1) | ARC-AGI (с вып. кода) | Источник |
|---|---|---|---|---|---|---|---|
| Gemini 3 Deep Think | 93.8% | не указано | не указано | не указано | не указано | официально | |
| Gemini 3.0 Pro | не указано | не указано | не указано | не указано | 45.1% (с вып. кода) | официально | |
| Gemini 2.5 Pro | 83.00% | не указано | не указано | не указано | не указано | официально | |
| Gemini 2.5 Flash | 82.80% | не указано | не указано | не указано | не указано | официально | |
| Gemini 2.5 Flash-Lite | 64.60% | не указано | не указано | не указано | не указано | официально | |
| OpenAI | GPT-5 | 85.70% | 92.50% | не указано | 93.40% | не указано | официально |
| OpenAI | GPT-4o mini | 40.20% | 82.00% | не указано | 87.20% | не указано | официально |
| xAI | Grok-4 Heavy | 88.40% | не указано | не указано | не указано | не указано | официально |
| xAI | Grok-4 | 87.50% | не указано | не указано | не указано | не указано | официально |
| Anthropic | Claude 3.7 Sonnet | 85.00% | не указано | не указано | не указано | не указано | официально |
| Anthropic | Claude 3.5 Sonnet | 67.20% | 90.40% | 77.60% | 93.70% | не указано | официально |
| DeepSeek | DeepSeek-R1-0528 | 81.00% | не указано | 85.00% | не указано | не указано | официально |
| DeepSeek | DeepSeek-V3 | 59.10% | 88.50% | 75.90% | не указано | не указано | официально |
| Meta | Llama 3.1 405B Instruct | 50.7% | 87.3% | 73.3% | 89.0% | не указано | официально |
| Meta | Llama 3.1 70B Instruct | 41.70% | 83.60% | 66.40% | 80.50% | не указано | официально |
| Alibaba | Qwen2.5 72B Instruct | 49.00% | не указано | 71.10% | 86.60% | не указано | не указано |
| Alibaba | Qwen2.5 32B Instruct | 49.50% | 83.30% | 69.00% | 88.40% | не указано | не указано |
| AI21 | Jamba 1.5 Large | 36.90% | 81.20% | 53.50% | не указано | не указано | официально |
| Microsoft | Phi 4 | 56.10% | 84.80% | 70.40% | 82.60% | не указано | официально |
Обновления на декабрь 2025
- Gemini 3.0 Pro GA (18 ноября) — запущена на Vertex AI, Google AI Studio и мобильное приложение Gemini; передовые рассуждения, генерация SVG-кода (+30% vs конкуренты), кодирование, многоходовые агентные задачи
- Gemini 3 Deep Think Превью — режим глубокого рассуждения для Gemini 3 Pro; 93.8% GPQA Diamond, 41.0% Humanity’s Last Exam; только для подписчиков AI Ultra
- Инструмент поиска по файлам GA — интегрированная RAG система с семантическим поиском, бесплатным хранилищем (1 ГБ–1 ТБ в зависимости от уровня), автоматическим разбиением (чанкингом); стоимость $0.15/1M за индексирование
- Пакетный API — асинхронная обработка с 50% скидкой (доступна для всех моделей)
- Кэширование контекста — кэширование для оптимизации стоимости на длинных запросах (попадания в кэш дешевле в 10 раз)
- Gemini 2.0 Flash Live устарела — будет выведена из эксплуатации 9 декабря 2025; рекомендуется переход на gemini-2.5-flash-native-audio-preview-09-2025 или gemini-2.5-flash
- Обновления цен — Gemini 3.0 Pro цены будут объявлены; Gemini 2.5 Flash-Lite остаётся самым доступным ($0.10 вход / $0.40 выход); кэширование контекста доступно для Pro и Flash