DeepSeek

DeepSeek — провайдер больших языковых моделей с публичным API и веб-чатом; платформа для доступа к моделям через веб-интерфейс, мобильные приложения (iOS/Android) и OpenAI‑совместимый API.
Текущая линейка облачных моделей для текстового API строится вокруг DeepSeek‑V4 (DeepSeek‑V4‑Flash и DeepSeek‑V4‑Pro) с миллионым контекстом и несколькими режимами рассуждений; старые идентификаторы deepseek-chat и deepseek-reasoner теперь являются алиасами V4‑Flash (обычный и режим рассуждений), а DeepSeek‑V3.2 и DeepSeek‑R1 остаются открытыми моделями для локального развёртывания.

Обновлено 4 июня 2026 года.

Факты

Название	DeepSeek
Официальный сайт	deepseek.com
Документация	api-docs.deepseek.com
Чат	chat.deepseek.com
Страна	Китай (Ханчжоу)
Разработчик	DeepSeek (Hangzhou DeepSeek Artificial Intelligence Co., Ltd.)
Открытый исходный код	Да — DeepSeek‑R1, DeepSeek‑V3.2 (включая V3.2‑Speciale) и семейство DeepSeek‑V4 (Flash/Pro) опубликованы как открытые веса с максимально разрешительными условиями: DeepSeek‑R1 и V3.2‑Speciale — под лицензией MIT, V4‑Flash/V4‑Pro также распространяются как открытые веса, доступные на Hugging Face и в официальных репозиториях DeepSeek.

Быстрые ссылки

История релизов

2024-12-26 / 2025-01-20 — линейка DeepSeek‑R1: выпуск открытой рассуждающей модели с обучением с подкреплением (RL), сопоставимой по качеству с OpenAI‑o1; позднее лицензия обновлена до MIT, опубликованы отчёт и дистиллированные варианты.
2025-08-21 — DeepSeek‑V3.1‑Terminus: официальный релиз с гибридной архитектурой (рассуждения + быстрый режим), улучшенным вызовом инструментов и поддержкой агентных сценариев; впоследствии заменён линейкой V3.2.
2025-09-29 — DeepSeek‑V3.2‑Exp (экспериментальная версия): запуск экспериментальной версии с более чем 50% снижением стоимости за счёт DeepSeek Sparse Attention (DSA) и ускорением в 2–3 раза для длинных контекстов; позже заменена официальной V3.2.
2025-12-01 — DeepSeek‑V3.2 (официальная версия): запуск V3.2 с режимом рассуждений и поддержкой вызова инструментов; обновление моделей API (deepseek-chat и deepseek-reasoner) и веб‑сервисов/приложений до V3.2 без изменения интерфейсов.
2025-12-01 — DeepSeek‑V3.2‑Speciale: выпуск открытого высокоинтенсивного варианта, ориентированного на максимально глубокие рассуждения; использует DSA и масштабное RL‑дообучение, достигает результатов уровня золотых медалей на IMO/IOI/ICPC; модель опубликована с открытыми весами под MIT.
2026-04-24 — DeepSeek‑V4 (V4‑Flash и V4‑Pro): запуск нового семейства Mixture of Experts (смесь экспертов)‑моделей с контекстом 1M токенов, гибридным вниманием (CSA+HCA), режимами thinking/без рассуждений и улучшенной эффективностью на длинных контекстах; V4‑Flash — быстрый и дешёвый вариант, V4‑Pro — флагманский вариант с рассуждениями с 1.6 трлн параметров (49B активных).

Модели (API)

ID (для API)	Тип / режим	Контекст	Кратко	Поддержка / ограничения	Цены ($/1M)	Документация
deepseek-v4-flash	Чат / общий (V4‑Flash, обычный + режим рассуждений)	до ~1 000 000 токенов контекста	Быстрая и дешевая модель общего назначения семейства DeepSeek‑V4. Mixture of Experts (смесь экспертов)‑архитектура (около 284B параметров, 13B активных) с гибридным вниманием CSA+HCA, оптимизирована под массовые нагрузки, длинные контексты и код; поддерживает как обычный режим, так и режим рассуждений с явными рассуждениями.	Совместима с `/chat/completions` в OpenAI‑формате; достаточно сменить `base_url` и `model`. JSON‑вывод: да; функция `response_format={"type": "json_schema"}` и аналогичные режимы поддерживаются. Вызов функций / вызовы инструментов: полная поддержка, включая работу в режим рассужденийе. Префикс чата / автодополнение и FIM: доступны в обычном (без рассуждений) режиме, используются для автодополнения кода и текстов. Режим рассуждений: управляется через параметры reasoning (например, `reasoning_effort`) и `extra_body={"thinking": {"type": "enabled"}}`; ход рассуждений отдаётся через `reasoning_content` (включая стриминг). Идентификаторы `deepseek-chat` и `deepseek-reasoner` теперь маршрутизируются на V4‑Flash (соответственно без рассуждений и thinking‑варианты) и помечены как легаси‑алиасы для обратной совместимости.	вход: $0.14; вход (кэш‑хит): ~$0.0028; выход: $0.28	V4‑Flash (спецификация)
deepseek-v4-pro	Рассуждающая (V4‑Pro, усиленный режим рассуждений)	до ~1 000 000 токенов контекста; до ~384K токенов вывода	Флагманская рассуждающая модель с 1.6 трлн параметров и 49B активных; Mixture of Experts (смесь экспертов)‑архитектура с гибридным вниманием, ориентирована на сложное программирование, многошаговые агентные цепочки и глубокие STEM‑задачи. Поддерживает уровни рассуждений (non‑think / high / max) и даёт вышее качество, чем V3.2 и V4‑Flash, особенно в режиме Max.	JSON‑вывод и вызов функций: поддерживаются, включая сочетание с режим рассужденийом и потоковой выдачей `reasoning_content` + `content`. Режимы рассуждений: non‑think (быстрый), think high (баланс глубины и скорости) и think max (максимальная глубина рассуждений; очень токеноёмкий). Формат вывода: цепочка рассуждений окружена тегами `<think>...</think>`, за которыми следует финальный ответ; в non‑think‑режиме thinking‑блок опускается. Изначально стоил $1.74/$3.48 за 1M токенов, но с апреля–мая 2026 года 75% скидка сделана постоянной, и теперь стандартные цены — $0.435 за вход и $0.87 за выход, с сильно удешевлёнными кэш‑хитами. Демонстрирует уровень GPQA Diamond ~90.1 в Max‑режиме и сильные результаты на кодинговых и агентных бенчмарках (LiveCodeBench, SWE‑bench и др.).	вход: $0.435; вход (кэш‑хит): ~$0.0036; выход: $0.87 (долгосрочная «скидка» сделана постоянной)	V4‑Pro (карточка модели)

Примечание: исторические модели DeepSeek‑V3.x и R1 по‑прежнему доступны как открытые веса (включая DeepSeek‑V3.2 и V3.2‑Speciale), но в облачном API основными точками входа стали deepseek-v4-flash и deepseek-v4-pro; легаси‑идентификаторы deepseek-chat и deepseek-reasoner маршрутизируются на V4‑Flash и помечены к постепенной деприкации, поэтому для новых проектов рекомендуется сразу использовать V4‑идентификаторы.

Ключевые особенности

Совместимый с OpenAI формат API: доступ через /chat/completions, можно использовать официальные OpenAI‑SDK и большинство совместимых клиентов при указании base_url=https://api.deepseek.com и корректного model.
Гибридное разрежённое внимание DeepSeek (DSA, CSA/HCA в V4): сильно снижает вычислительную стоимость и объём KV‑кэша на длинных контекстах; при контексте 1M DeepSeek‑V4‑Pro требует около 27% FLOPs и 10% KV‑кэша по сравнению с V3.2.
Гибридная архитектура V4: единая модель поддерживает как быстрый non‑режим рассуждений, так и глубокие режимы рассуждений (high/max), переключаемые параметрами запроса; это позволяет выбирать баланс между скоростью и качеством в зависимости от задачи.
Режим рассуждений (Thinking Mode) с явным полем reasoning_content и тэгами <think>...</think>; ход рассуждений можно получать и стримить отдельно от пользовательского ответа, использовать для отладки, оценки и агентных сценариев.
JSON‑режим и вызов функций поддерживаются как в обычном режиме, так и при активном режим рассужденийе, с полноценной передачей tool_calls и аргументов, что упрощает построение агентов и интеграцию с инструментами.
Полностью открытые веса под MIT для DeepSeek‑R1, V3.2‑Speciale и семейства V4 (Flash/Pro), с доступными дистиллятами (например, на базе Qwen и Llama) для более лёгкого локального развёртывания.
Потоковая передача, кэширование контекста и отдельные тарифы для кэш‑хитов (до 98% скидки для V4‑Flash); это существенно снижает стоимость типичных рабочих нагрузок с повторяющимися частями промпта.
Сильный упор на рассуждения и математику: линейка V3.2‑Speciale и V4‑Pro демонстрирует результаты уровня золотых медалей на олимпиадах IMO/IOI/ICPC и конкурентный уровень с GPT‑5.x/Claude/Gemini‑3.x на GPQA Diamond, HumanEval и других reasoning‑бенчмарках.

Ограничения и риски

Режимы с максимальными рассуждениями (V4‑Pro Max, глубокий thinking у V4‑Flash) резко увеличивают расход токенов: в независимых оценках V4‑Pro Max тратит в разы больше выходных токенов, чем средний открытые веса конкурент, что критично для большого потока запросов без контроля длины ответа.
В режим рассужденийе часть параметров генерации и настройки стиля может интерпретироваться иначе или иметь меньшее влияние; поведение модели становится более детерминированным, но менее гибким по формату ответа.
Базовые наборы знаний моделей V3.2/V4, согласно публичным материалам, в основном охватывают данные до примерно 2024–начала 2025 годов; для более свежей информации требуется встроенный поиск или внешние источники знаний.
Глубокие цепочки рассуждений могут быть избыточны для простых задач: модель склонна подробно расписывать ход мысли, что удорожает и замедляет ответы; для тривиальных и средних по сложности случаев рекомендуется использовать обычный (без рассуждений) режим V4‑Flash.
Юридические и регуляторные аспекты: базирование компании в Китае (Ханчжоу) может требовать отдельной оценки рисков (особенно для корпоративных клиентов с жёсткими требованиями по юрисдикции и передаче данных).
Как и другие крупные LLM, V4‑Flash/V4‑Pro подвержены галлюцинациям; для V4‑Pro известно, что на бенчмарках «omniscience» модель часто отвечает даже при отсутствии знаний, а не отказывается, что требует дополнительных слоёв валидации и проверки фактов.

Сравнение цен

Чат (подписка)

Провайдер	План / уровень	Цена (как в официальном/агрегированном источнике)	Ссылка
DeepSeek	Веб‑чат / мобильное приложение	Бесплатно; нет обязательных платных уровней для пользовательского чата, используется политика добросовестное использование (ограничения по нагрузке).	страница
OpenAI	ChatGPT Plus	$20 / месяц (типичный тариф для премиум‑доступа к GPT‑5.x).	цены
Anthropic	Claude Pro	$20 / месяц (при помесячной оплате).	цены
Google	Gemini AI Pro (Google One)	$19.99 / месяц.	цены

API (модели)

Провайдер	Модель / ID	вход (кэш‑хит), $/1M	вход (без кэша), $/1M	выход, $/1M	Примечания	Ссылка
DeepSeek	deepseek-v4-flash	$0.0028	$0.14	$0.28	Дешёвый и быстрый рабочий «флэш»‑вариант с 1M контекстом и thinking/non‑режим рассужденийами.	цены
DeepSeek	deepseek-v4-pro	~$0.0036	$0.435	$0.87	Флагманский вариант с рассуждениями; 75% первоначальной скидки закреплено как постоянное снижение цен.	цены
DeepSeek (легаси)	deepseek-chat / deepseek-reasoner	см. V4‑Flash	см. V4‑Flash	см. V4‑Flash	Легаси‑алиасы, теперь маршрутизируются на V4‑Flash (соответственно без рассуждений и thinking‑варианты) и помечены к деприкации.	документация
OpenAI	gpt-5	— (кэш расценивается отдельно)	$1.25	$10.00	Флагманская модель GPT‑5, 400K контекст; цены по данным актуальных калькуляторов/документации.	цены
Anthropic	Claude Sonnet 4.5	—	$3.00	$15.00	Модель среднего уровня; цены по состоянию на 2026 год.	цены
Google	gemini-2.5-flash	—	$0.30	$2.50	Быстрая модель с длинным контекстом; цены по официальной документации.	цены

Бенчмарки (официальные и независимые; 2025–2026)

Провайдер	Модель / ID	MMLU	MMLU Pro	GPQA Diamond	HumanEval	AIME / MATH (если указано)	Источник
DeepSeek	DeepSeek‑V4‑Flash (базовая версия)	~88.7%	~68.3%	—	~69.5%	—	DeepInfra обзор V4
DeepSeek	DeepSeek‑V4‑Pro (базовая версия)	~90.1%	~73.5%	— (Max: ~90.1%)	~76.8%	—	DeepInfra обзор V4
DeepSeek	DeepSeek‑V3.2 (базовая версия)	~87.8%	~65.5%	~75.1%	~62.8%	—	цены/бенчмарки V3.2
DeepSeek	DeepSeek‑V3.2‑Speciale	—	—	—	—	золотой уровень на IMO/IOI/ICPC; MATH≈92%, HumanEval≈90% (по техническому отчёту)	отчёт V3.2
DeepSeek	DeepSeek‑R1	~90.8%	~84.0%	~71.5%	~92.4%	AIME 2024: 79.8% (Pass@1), 86.7% (self‑consistency)	DeepSeek‑R1
OpenAI	GPT‑5	~92–93%	—	~85–93% (зависит от версии)	~93–94%	—	аналитика GPT‑5.2
Anthropic	Claude Sonnet 4.5	~90% (по независимым сводкам)	—	~83–85%	~90%+	—	ценовой/бенчмарк‑агрегатор

Обновления июня 2026

DeepSeek‑V4 (Flash/Pro) стал основной линейкой API: V4‑Flash заменяет V3.2 как дешёвый «рабочий» вариант, а V4‑Pro — как флагман класса рассуждающих моделей; легаси‑идентификаторы deepseek-chat и deepseek-reasoner маршрутизируются на V4‑Flash и помечены для вывода из оборота.
Долгосрочное снижение цен на V4‑Pro: 75% промо‑скидка, действовавшая до конца мая 2026 года, сделана постоянной; итоговая цена V4‑Pro — $0.435/$0.87 за 1M токенов, что делает модель одним из самых дешёвых открытых флагманов класса рассуждающих моделей на рынке.
Укрепление позиций в бенчмарках: независимые обзоры подтверждают, что V4‑Pro Max конкурирует с GPT‑5.4, Claude Opus 4.6/4.7 и Gemini‑3.1‑Pro на задачах GPQA Diamond, LiveCodeBench и SWE‑bench Verified, при этом остаётся существенно дешевле по цене за токен.
Локальная экосистема V4: V4‑Flash и V4‑Pro появились в экосистемах Ollama, NVIDIA NIM, VS Code/JetBrains‑плагинах и как INT4‑/INT8‑квантизованные сборки на Hugging Face, что упрощает локальное и гибридное развёртывание.
Бесплатный веб‑чат и тестовый API: DeepSeek продолжает предлагать бесплатный веб‑чат и разовый грант на 5M токенов для новых API‑аккаунтов, что делает платформу привлекательной для разработчиков и небольших команд.