Gemini

Google Gemini — провайдер мультимодальных больших языковых моделей с доступом через API и Vertex AI, а также потребительский веб-чат Gemini (включая подписки Google AI Plus / Pro / Ultra). Актуальная линейка — Gemini 3 (Pro / Pro Image / Flash) и Gemini 2.5 (Pro / Flash / Flash-Lite / Flash Image / Computer Use) с режимами «мышления» и управляемым бюджетом рассуждений.

API поддерживает структурированный вывод, вызов функций, инструменты (в т.ч. обоснование через Google Search и Карты, поиск по файлам), управление компьютером через специализированную модель и инструмент Computer Use, длинный контекст до 1M+ токенов, API реального времени (Gemini Live API) для потоковых мультимодальных взаимодействий и собственные модели для создания изображений и видео.

Обновлено 9 февраля 2026 года.

Факты

Название	Google Gemini
Официальный сайт	deepmind.google
Документация	ai.google.dev/gemini-api/docs
Чат	gemini.google.com
Страна	США
Разработчик	Google / DeepMind
Доступ	API: документация Чат: веб-клиент (бесплатный доступ и планы Google AI Plus / Pro / Ultra) Vertex AI: модели и возможности Google AI Studio: интерактивная среда

Быстрые ссылки

История релизов

2026-01-29 — Computer Use для Gemini 3 Pro и Gemini 3 Flash: инструмент управления компьютером официально поддерживается в gemini-3-pro-preview и gemini-3-flash-preview через новый инструмент computer_use в Gemini API — ссылка
2026-01-26 — Google AI Plus: более дешёвый план подписки с доступом к Gemini 3 Pro, Deep Research и Nano Banana Pro в приложении Gemini — ссылка
2026-01-22 — Анонс вывода моделей Gemini 2.0 Flash и Flash-Lite из эксплуатации к 31 марта 2026 года; рекомендована миграция на Gemini 2.5 Flash — ссылка
2026-01-03 — Agentic Vision для Gemini 3 Flash: активное «исследующее» зрение для улучшения качества мультимодального восприятия — ссылка
2025-12-17 — Gemini 3 Flash: релиз в превью на Vertex AI и Google AI Studio; 90.4% GPQA Diamond, 81.2% MMMU Pro, 78% SWE-bench Verified, в 3 раза быстрее, чем 2.5 Pro, менее четверти цены Gemini 3 Pro — ссылка
2025-12-15 — Gemini Deep Research с визуальными отчётами — ссылка
2025-12-10 — Обновления синтеза речи: Gemini 2.5 Flash TTS и Gemini 2.5 Pro TTS в превью — ссылка
2025-12-09 — Отключение Gemini 2.0 Flash Live и Gemini Live 2.5 Flash Preview — ссылка
2025-11-18 — Gemini 3.0 Pro: релиз на Vertex AI, Google AI Studio и мобильное приложение Gemini — ссылка
2025-11-18 — Gemini 3 Deep Think: режим глубокого рассуждения для AI Ultra — ссылка
2025-11-05 — Инструмент поиска по файлам: публичный релиз с бесплатным хранилищем и семантическим поиском — ссылка
2025-10-07 — Gemini 2.5 Computer Use (превью): релиз специализированной модели для автоматизации интерфейсов и браузера — ссылка

Модели (API)

ID (для API)	Тип / режим	Контекст	Кратко	Поддержка / ограничения	Цены ($/1M)	Документация
gemini-3-flash-preview	Мультимодальная, быстрая (передовая)	1,048,576 вход; 65,536 выход	Быстрая альтернатива 3 Pro: 90.4% GPQA Diamond, 81.2% MMMU Pro, 78% SWE-bench Verified, ~3x быстрее 2.5 Pro, менее четверти цены 3 Pro.	Превью в Gemini API, Google AI Studio и Vertex AI Вызов функций, структурированный вывод, обоснование через Google Search / Maps Поиск по файлам, API реального времени (Gemini Live API), Agentic Vision для улучшенного зрения Управление компьютером через инструмент Computer Use (превью)	вход: $0.50 (текст/изображения/видео), $1.00 (аудио); выход: $3.00	документация
gemini-3-pro-preview	Мультимодальная, рассуждающая (флагман)	1,048,576 вход; 65,536 выход	Следующее поколение: улучшенное программирование, мультимодальное понимание, агентные сценарии, передовые рассуждения.	Превью на Vertex AI и Google AI Studio Улучшены: программирование, создание интерфейсов, многошаговые рассуждения, Deep Research Вызов функций, структурированный вывод, обоснование, поиск по файлам Управление компьютером через инструмент Computer Use (превью)	вход: $2.00 (≤200k) / $4.00 (>200k); выход: $12.00 (≤200k) / $18.00 (>200k)	документация
gemini-3-deep-think-preview	Мультимодальная, глубокое рассуждение	1,048,576 вход; 65,536 выход	Режим глубокого рассуждения для Gemini 3 Pro; лучшие показатели на Humanity’s Last Exam.	Превью (только подписчики Google AI Ultra / AI Pro с доступом к AI Ultra в будущем) Регулярные обновления качества Оптимизирована для STEM-задач и математики	включена в подписку Google AI Ultra	документация
gemini-2.5-pro	Мультимодальная, рассуждающая	1,048,576 вход; 65,536 выход	Флагман 2.5 для кода и сложных рассуждений; стабильная модель для продакшена.	Вызов функций, структурированный вывод, обоснование, поиск по файлам Кэширование контекста; управление компьютером не поддерживается напрямую Общая доступность; рекомендуется для критичных продакшн-нагрузок	вход: $1.25 (≤200k) / $2.50 (>200k); выход: $10.00 (≤200k) / $15.00 (>200k)	документация
gemini-2.5-flash	Гибридные рассуждения (вкл/выкл)	до 1,000,000	Ускоренная 2.5 с управляемым «мышлением» и API реального времени; баланс качества, цены и скорости.	Вызов функций, обоснование, поиск по файлам, API реального времени (Gemini Live API) До 1M контекста; бюджеты на «мышление» Общая доступность; основная рабочая «лошадка» для масштабных задач	вход: $0.30 (текст/изображения/видео), $1.00 (аудио); выход: $2.50	документация
gemini-2.5-flash-lite	Экономичная (2.5), рассуждающая	до 1,000,000	Минимальная цена и задержка в серии 2.5; для высоких объёмов и периферийных вычислений.	Вызов функций, обоснование, поиск по файлам До 1M контекста; бюджеты на «мышление» Общая доступность; оптимизирована под дешёвое масштабирование	вход: $0.10 (текст/изображения/видео), $0.30 (аудио); выход: $0.40	документация
gemini-2.5-flash-image	Собственный генератор изображений (Nano Banana)	до 65,536 вход; 32,768 выход	Встроенное создание и редактирование изображений в стиле Nano Banana; быстрый, с цифровым водяным знаком SynthID.	Собственный генератор и редактор изображений Общая доступность в Gemini API, Google AI Studio и Vertex AI Оптимизирован для высоких объёмов и низкой задержки	вход: $0.30 (текст/изображение); выход: ≈$0.039 за изображение	документация
gemini-2.5-computer-use-preview-10-2025	Автоматизация интерфейсов (Computer Use)	128,000 вход; 64,000 выход	Специализированная модель на базе 2.5 Pro для управления веб-интерфейсами и браузерной автоматизации через инструмент Computer Use.	Инструмент Computer Use: клики, ввод текста, прокрутка, перетаскивание и др. Оптимизирована под браузеры; поддержка мобильных сценариев — в разработке Превью; те же тарифы, что и Gemini 2.5 Pro	вход: $1.25 (≤200k) / $2.50 (>200k); выход: $10.00 (≤200k) / $15.00 (>200k)	документация
gemini-2.0-flash	Мультимодальная (2.0)	до 1,000,000	Сбалансированная мультимодальная модель 2.0; стабильна, но объявлен вывод из эксплуатации 31 марта 2026 года.	Вызов функций, обоснование, API реального времени Кэширование контекста Общая доступность до 31.03.2026; далее будет отключена	вход: $0.10 (текст/изображения/видео), $0.70 (аудио); выход: $0.40	документация

Ключевые особенности

Развёртывание через Google AI Studio (Gemini API) и Vertex AI; единая экосистема для разработчиков и корпоративных пользователей.
Режимы «мышления» и управляемые бюджеты рассуждений в серии 2.5 и 3; Gemini 3 Deep Think для передовых рассуждений.
Вызов функций, структурированный вывод, инструменты и обоснование через Google Search и Карты.
Поиск по файлам — интегрированная система извлечения и расширения контекста с семантическим поиском и бесплатным хранилищем.
Управление компьютером (Computer Use) для автоматизации браузерных и частично мобильных интерфейсов.
Собственные модели генерации изображений: Gemini 2.5 Flash Image и Gemini 3 Pro Image.
Собственные модели генерации видео (Veo 3, Veo 3.1 Fast) через Gemini API и подписки AI Pro / Ultra.
Длинный контекст до 1M+ токенов в моделях 2.5 и 3.
Gemini Live API для потоковых мультимодальных взаимодействий: аудиовывод, двунаправленный WebSocket, поддержка функций.
Кэширование контекста для оптимизации стоимости на длинных запросах.
Пакетный API с примерно 50% скидкой для асинхронной обработки.
Deep Research с визуальными отчётами для подписчиков AI Ultra и расширенный Deep Research для AI Pro / Plus.
Страница статуса и журнал инцидентов с гарантиями уровня обслуживания (SLA) для платных планов.

Ограничения и риски

Gemini 3 Pro и Flash остаются в статусе превью; возможны изменения качества, цен и интерфейсов API.
Gemini 3 Deep Think — превью только для подписчиков AI Ultra.
Обоснование через Google Search имеет отдельную тарификацию после бесплатного лимита.
API реального времени требует использования WebSocket и отдельной настройки.
Поиск по файлам имеет ограничения по размеру хранилища.
Computer Use — превью, требует дополнительных мер безопасности.
Цены зависят от модели и типа тарифа и могут меняться.
Актуальность знаний моделей — примерно январь 2025 года.
Deep Research и расширенная генерация видео доступны только в платных планах.
Модели Gemini 2.0 Flash и Flash-Lite будут отключены 31 марта 2026 года.

Сравнение цен

Чат (подписка)

Провайдер	План / уровень	Цена (USD)	Ссылка
Google	Google AI Plus	$7.99 / месяц (в США; промо $3.99 первые 2 месяца)	страница
Google	Google AI Pro	$19.99 / месяц	страница
Google	Google AI Ultra	$249.99 / месяц	страница
OpenAI	ChatGPT Plus	$20 / месяц	цены
OpenAI	ChatGPT Pro	$200 / месяц	цены
Anthropic	Claude Pro	$20 / месяц	цены
Mistral	Le Chat Pro	≈€14.99 / месяц	цены

API (модели)

Провайдер	Модель / ID	вход (≤200k), $/1M	вход (>200k), $/1M	выход, $/1M
Google	gemini-3-flash-preview	$0.50 (текст/изображения/видео), $1.00 (аудио)	$0.50 (текст/изображения/видео), $1.00 (аудио)	$3.00
Google	gemini-3-pro-preview	$2.00	$4.00	$12.00 / $18.00
Google	gemini-3-deep-think-preview	в подписке AI Ultra	в подписке AI Ultra	в подписке AI Ultra
Google	gemini-2.5-pro	$1.25	$2.50	$10.00 / $15.00
Google	gemini-2.5-flash	$0.30 (текст/изображения/видео), $1.00 (аудио)	$0.30 (текст/изображения/видео), $1.00 (аудио)	$2.50
Google	gemini-2.5-flash-lite	$0.10 (текст/изображения/видео), $0.30 (аудио)	$0.10 (текст/изображения/видео), $0.30 (аудио)	$0.40
OpenAI	gpt-4o	$1.25	$1.25	$5.00
Anthropic	claude-3.5-sonnet	$3.00	$3.00	$15.00

Бенчмарки

Провайдер	Модель / ID	GPQA (Diamond)	Humanity’s Last Exam	MMMU Pro	SWE-bench Verified	Источник
Google	Gemini 3 Deep Think	93.8%	41.0%	не указано	не указано	официально
Google	Gemini 3.0 Pro	не указано	37.5%	не указано	не указано	официально
Google	Gemini 3 Flash	90.4%	33.7%	81.2%	78%	официально
Google	Gemini 2.5 Pro	83.0%	18.8%	81.7%	63.8%	официально
Google	Gemini 2.5 Flash	82.8%	не указано	не указано	не указано	официально
OpenAI	GPT-4o	~65.6%	~31.6%	не указано	не указано	официально / сторонние обзоры
Anthropic	Claude 3.5 Sonnet	67.2%	не указано	78.7%	не указано	официально
xAI	Grok-4	87.5%	не указано	не указано	не указано	официально

Обновления на февраль 2026

Gemini 3 Flash — быстрая модель с высоким уровнем рассуждений и производительности.
Agentic Vision — улучшенное визуальное восприятие изображений.
Gemini Deep Research — создание визуальных аналитических отчётов.
Gemini 3 Pro — улучшенные рассуждения и программирование.
Gemini 3 Deep Think — режим глубокого рассуждения.
Обновления синтеза речи — улучшенная выразительность и естественность.
Поиск по файлам — встроенный семантический поиск с оплатой за индексирование.
Кэширование контекста — снижение стоимости при повторном использовании данных.
Пакетный API — скидка на асинхронную обработку.
Grounding через Google Search — обновлённая модель тарификации.
Google AI Plus — доступный тариф с расширенными возможностями.
Депрекация Gemini 2.0 Flash / Flash-Lite — отключение 31 марта 2026 года.