Факты
| Название | DeepSeek |
| Официальный сайт | deepseek.com |
| Документация | api-docs.deepseek.com |
| Чат | chat.deepseek.com |
| Страна | Китай (Ханчжоу) |
| Разработчик | DeepSeek (Hangzhou DeepSeek Artificial Intelligence Co., Ltd.) |
| Открытый исходный код | Да — DeepSeek‑R1, DeepSeek‑V3.2 (включая V3.2‑Speciale) и семейство DeepSeek‑V4 (Flash/Pro) опубликованы как открытые веса с максимально разрешительными условиями: DeepSeek‑R1 и V3.2‑Speciale — под лицензией MIT, V4‑Flash/V4‑Pro также распространяются как открытые веса, доступные на Hugging Face и в официальных репозиториях DeepSeek. |
Быстрые ссылки
- Документация
- Модели и цены
- JSON-вывод
- Вызов функций
- Режим рассуждений
- V3.2 GitHub
- R1 GitHub
- Статус
- Журнал изменений / Обновления
История релизов
- 2024-12-26 / 2025-01-20 — линейка DeepSeek‑R1: выпуск открытой рассуждающей модели с обучением с подкреплением (RL), сопоставимой по качеству с OpenAI‑o1; позднее лицензия обновлена до MIT, опубликованы отчёт и дистиллированные варианты.
- 2025-08-21 — DeepSeek‑V3.1‑Terminus: официальный релиз с гибридной архитектурой (рассуждения + быстрый режим), улучшенным вызовом инструментов и поддержкой агентных сценариев; впоследствии заменён линейкой V3.2.
- 2025-09-29 — DeepSeek‑V3.2‑Exp (экспериментальная версия): запуск экспериментальной версии с более чем 50% снижением стоимости за счёт DeepSeek Sparse Attention (DSA) и ускорением в 2–3 раза для длинных контекстов; позже заменена официальной V3.2.
- 2025-12-01 — DeepSeek‑V3.2 (официальная версия): запуск V3.2 с режимом рассуждений и поддержкой вызова инструментов; обновление моделей API (
deepseek-chatиdeepseek-reasoner) и веб‑сервисов/приложений до V3.2 без изменения интерфейсов. - 2025-12-01 — DeepSeek‑V3.2‑Speciale: выпуск открытого высокоинтенсивного варианта, ориентированного на максимально глубокие рассуждения; использует DSA и масштабное RL‑дообучение, достигает результатов уровня золотых медалей на IMO/IOI/ICPC; модель опубликована с открытыми весами под MIT.
- 2026-04-24 — DeepSeek‑V4 (V4‑Flash и V4‑Pro): запуск нового семейства Mixture of Experts (смесь экспертов)‑моделей с контекстом 1M токенов, гибридным вниманием (CSA+HCA), режимами thinking/без рассуждений и улучшенной эффективностью на длинных контекстах; V4‑Flash — быстрый и дешёвый вариант, V4‑Pro — флагманский вариант с рассуждениями с 1.6 трлн параметров (49B активных).
Модели (API)
| ID (для API) | Тип / режим | Контекст | Кратко | Поддержка / ограничения | Цены ($/1M) | Документация |
|---|---|---|---|---|---|---|
| deepseek-v4-flash | Чат / общий (V4‑Flash, обычный + режим рассуждений) | до ~1 000 000 токенов контекста | Быстрая и дешевая модель общего назначения семейства DeepSeek‑V4. Mixture of Experts (смесь экспертов)‑архитектура (около 284B параметров, 13B активных) с гибридным вниманием CSA+HCA, оптимизирована под массовые нагрузки, длинные контексты и код; поддерживает как обычный режим, так и режим рассуждений с явными рассуждениями. |
|
вход: $0.14; вход (кэш‑хит): ~$0.0028; выход: $0.28 | V4‑Flash (спецификация) |
| deepseek-v4-pro | Рассуждающая (V4‑Pro, усиленный режим рассуждений) | до ~1 000 000 токенов контекста; до ~384K токенов вывода | Флагманская рассуждающая модель с 1.6 трлн параметров и 49B активных; Mixture of Experts (смесь экспертов)‑архитектура с гибридным вниманием, ориентирована на сложное программирование, многошаговые агентные цепочки и глубокие STEM‑задачи. Поддерживает уровни рассуждений (non‑think / high / max) и даёт вышее качество, чем V3.2 и V4‑Flash, особенно в режиме Max. |
|
вход: $0.435; вход (кэш‑хит): ~$0.0036; выход: $0.87 (долгосрочная «скидка» сделана постоянной) | V4‑Pro (карточка модели) |
deepseek-v4-flash и deepseek-v4-pro; легаси‑идентификаторы deepseek-chat и deepseek-reasoner маршрутизируются на V4‑Flash и помечены к постепенной деприкации, поэтому для новых проектов рекомендуется сразу использовать V4‑идентификаторы.Ключевые особенности
- Совместимый с OpenAI формат API: доступ через
/chat/completions, можно использовать официальные OpenAI‑SDK и большинство совместимых клиентов при указанииbase_url=https://api.deepseek.comи корректногоmodel. - Гибридное разрежённое внимание DeepSeek (DSA, CSA/HCA в V4): сильно снижает вычислительную стоимость и объём KV‑кэша на длинных контекстах; при контексте 1M DeepSeek‑V4‑Pro требует около 27% FLOPs и 10% KV‑кэша по сравнению с V3.2.
- Гибридная архитектура V4: единая модель поддерживает как быстрый non‑режим рассуждений, так и глубокие режимы рассуждений (high/max), переключаемые параметрами запроса; это позволяет выбирать баланс между скоростью и качеством в зависимости от задачи.
- Режим рассуждений (Thinking Mode) с явным полем
reasoning_contentи тэгами<think>...</think>; ход рассуждений можно получать и стримить отдельно от пользовательского ответа, использовать для отладки, оценки и агентных сценариев. - JSON‑режим и вызов функций поддерживаются как в обычном режиме, так и при активном режим рассужденийе, с полноценной передачей
tool_callsи аргументов, что упрощает построение агентов и интеграцию с инструментами. - Полностью открытые веса под MIT для DeepSeek‑R1, V3.2‑Speciale и семейства V4 (Flash/Pro), с доступными дистиллятами (например, на базе Qwen и Llama) для более лёгкого локального развёртывания.
- Потоковая передача, кэширование контекста и отдельные тарифы для кэш‑хитов (до 98% скидки для V4‑Flash); это существенно снижает стоимость типичных рабочих нагрузок с повторяющимися частями промпта.
- Сильный упор на рассуждения и математику: линейка V3.2‑Speciale и V4‑Pro демонстрирует результаты уровня золотых медалей на олимпиадах IMO/IOI/ICPC и конкурентный уровень с GPT‑5.x/Claude/Gemini‑3.x на GPQA Diamond, HumanEval и других reasoning‑бенчмарках.
Рекомендации по применению
- DeepSeek‑V4‑Flash: основной «рабочий» вариант для ассистентов и чат‑ботов общего назначения, структурированного вывода (JSON), интеграций через OpenAI‑совместимые SDK, массовой обработки текста и кода при низкой цене; хорошо подходит как дефолтная модель для продуктов, где критичны цена и пропускная способность, но не требуется максимально глубокое рассуждение.
- DeepSeek‑V4‑Pro: задачи, критичные к качеству рассуждений — сложная математика, продвинутое программирование, многошаговое планирование, агентные сценарии, где модель может «думать» в режиме Think High/Max; оправдывает более высокую цену на токен при задачах, требующих надёжной логики и долгих цепочек рассуждений.
- Открытые модели V3.2 / V3.2‑Speciale / R1 (локально): сценарии, где нужен полный контроль над данными и инфраструктурой или запрещены внешние API; эксперименты с архитектурой и дообучением, а также внутренние системы с повышенными требованиями к приватности.
Ограничения и риски
- Режимы с максимальными рассуждениями (V4‑Pro Max, глубокий thinking у V4‑Flash) резко увеличивают расход токенов: в независимых оценках V4‑Pro Max тратит в разы больше выходных токенов, чем средний открытые веса конкурент, что критично для большого потока запросов без контроля длины ответа.
- В режим рассужденийе часть параметров генерации и настройки стиля может интерпретироваться иначе или иметь меньшее влияние; поведение модели становится более детерминированным, но менее гибким по формату ответа.
- Базовые наборы знаний моделей V3.2/V4, согласно публичным материалам, в основном охватывают данные до примерно 2024–начала 2025 годов; для более свежей информации требуется встроенный поиск или внешние источники знаний.
- Глубокие цепочки рассуждений могут быть избыточны для простых задач: модель склонна подробно расписывать ход мысли, что удорожает и замедляет ответы; для тривиальных и средних по сложности случаев рекомендуется использовать обычный (без рассуждений) режим V4‑Flash.
- Юридические и регуляторные аспекты: базирование компании в Китае (Ханчжоу) может требовать отдельной оценки рисков (особенно для корпоративных клиентов с жёсткими требованиями по юрисдикции и передаче данных).
- Как и другие крупные LLM, V4‑Flash/V4‑Pro подвержены галлюцинациям; для V4‑Pro известно, что на бенчмарках «omniscience» модель часто отвечает даже при отсутствии знаний, а не отказывается, что требует дополнительных слоёв валидации и проверки фактов.
Сравнение цен
Чат (подписка)
| Провайдер | План / уровень | Цена (как в официальном/агрегированном источнике) | Ссылка |
|---|---|---|---|
| DeepSeek | Веб‑чат / мобильное приложение | Бесплатно; нет обязательных платных уровней для пользовательского чата, используется политика добросовестное использование (ограничения по нагрузке). | страница |
| OpenAI | ChatGPT Plus | $20 / месяц (типичный тариф для премиум‑доступа к GPT‑5.x). | цены |
| Anthropic | Claude Pro | $20 / месяц (при помесячной оплате). | цены |
| Gemini AI Pro (Google One) | $19.99 / месяц. | цены |
API (модели)
| Провайдер | Модель / ID | вход (кэш‑хит), $/1M | вход (без кэша), $/1M | выход, $/1M | Примечания | Ссылка |
|---|---|---|---|---|---|---|
| DeepSeek | deepseek-v4-flash | $0.0028 | $0.14 | $0.28 | Дешёвый и быстрый рабочий «флэш»‑вариант с 1M контекстом и thinking/non‑режим рассужденийами. | цены |
| DeepSeek | deepseek-v4-pro | ~$0.0036 | $0.435 | $0.87 | Флагманский вариант с рассуждениями; 75% первоначальной скидки закреплено как постоянное снижение цен. | цены |
| DeepSeek (легаси) | deepseek-chat / deepseek-reasoner | см. V4‑Flash | см. V4‑Flash | см. V4‑Flash | Легаси‑алиасы, теперь маршрутизируются на V4‑Flash (соответственно без рассуждений и thinking‑варианты) и помечены к деприкации. | документация |
| OpenAI | gpt-5 | — (кэш расценивается отдельно) | $1.25 | $10.00 | Флагманская модель GPT‑5, 400K контекст; цены по данным актуальных калькуляторов/документации. | цены |
| Anthropic | Claude Sonnet 4.5 | — | $3.00 | $15.00 | Модель среднего уровня; цены по состоянию на 2026 год. | цены |
| gemini-2.5-flash | — | $0.30 | $2.50 | Быстрая модель с длинным контекстом; цены по официальной документации. | цены |
Бенчмарки (официальные и независимые; 2025–2026)
| Провайдер | Модель / ID | MMLU | MMLU Pro | GPQA Diamond | HumanEval | AIME / MATH (если указано) | Источник |
|---|---|---|---|---|---|---|---|
| DeepSeek | DeepSeek‑V4‑Flash (базовая версия) | ~88.7% | ~68.3% | — | ~69.5% | — | DeepInfra обзор V4 |
| DeepSeek | DeepSeek‑V4‑Pro (базовая версия) | ~90.1% | ~73.5% | — (Max: ~90.1%) | ~76.8% | — | DeepInfra обзор V4 |
| DeepSeek | DeepSeek‑V3.2 (базовая версия) | ~87.8% | ~65.5% | ~75.1% | ~62.8% | — | цены/бенчмарки V3.2 |
| DeepSeek | DeepSeek‑V3.2‑Speciale | — | — | — | — | золотой уровень на IMO/IOI/ICPC; MATH≈92%, HumanEval≈90% (по техническому отчёту) | отчёт V3.2 |
| DeepSeek | DeepSeek‑R1 | ~90.8% | ~84.0% | ~71.5% | ~92.4% | AIME 2024: 79.8% (Pass@1), 86.7% (self‑consistency) | DeepSeek‑R1 |
| OpenAI | GPT‑5 | ~92–93% | — | ~85–93% (зависит от версии) | ~93–94% | — | аналитика GPT‑5.2 |
| Anthropic | Claude Sonnet 4.5 | ~90% (по независимым сводкам) | — | ~83–85% | ~90%+ | — | ценовой/бенчмарк‑агрегатор |
Обновления июня 2026
- DeepSeek‑V4 (Flash/Pro) стал основной линейкой API: V4‑Flash заменяет V3.2 как дешёвый «рабочий» вариант, а V4‑Pro — как флагман класса рассуждающих моделей; легаси‑идентификаторы
deepseek-chatиdeepseek-reasonerмаршрутизируются на V4‑Flash и помечены для вывода из оборота. - Долгосрочное снижение цен на V4‑Pro: 75% промо‑скидка, действовавшая до конца мая 2026 года, сделана постоянной; итоговая цена V4‑Pro — $0.435/$0.87 за 1M токенов, что делает модель одним из самых дешёвых открытых флагманов класса рассуждающих моделей на рынке.
- Укрепление позиций в бенчмарках: независимые обзоры подтверждают, что V4‑Pro Max конкурирует с GPT‑5.4, Claude Opus 4.6/4.7 и Gemini‑3.1‑Pro на задачах GPQA Diamond, LiveCodeBench и SWE‑bench Verified, при этом остаётся существенно дешевле по цене за токен.
- Локальная экосистема V4: V4‑Flash и V4‑Pro появились в экосистемах Ollama, NVIDIA NIM, VS Code/JetBrains‑плагинах и как INT4‑/INT8‑квантизованные сборки на Hugging Face, что упрощает локальное и гибридное развёртывание.
- Бесплатный веб‑чат и тестовый API: DeepSeek продолжает предлагать бесплатный веб‑чат и разовый грант на 5M токенов для новых API‑аккаунтов, что делает платформу привлекательной для разработчиков и небольших команд.