Факты

Название DeepSeek
Официальный сайт deepseek.com
Документация api-docs.deepseek.com
Чат chat.deepseek.com
Страна Китай (Ханчжоу)
Разработчик DeepSeek (Hangzhou DeepSeek Artificial Intelligence Co., Ltd.)
Открытый исходный код Да — DeepSeek‑R1, DeepSeek‑V3.2 (включая V3.2‑Speciale) и семейство DeepSeek‑V4 (Flash/Pro) опубликованы как открытые веса с максимально разрешительными условиями: DeepSeek‑R1 и V3.2‑Speciale — под лицензией MIT, V4‑Flash/V4‑Pro также распространяются как открытые веса, доступные на Hugging Face и в официальных репозиториях DeepSeek.

Быстрые ссылки

История релизов

  • 2024-12-26 / 2025-01-20 — линейка DeepSeek‑R1: выпуск открытой рассуждающей модели с обучением с подкреплением (RL), сопоставимой по качеству с OpenAI‑o1; позднее лицензия обновлена до MIT, опубликованы отчёт и дистиллированные варианты.
  • 2025-08-21 — DeepSeek‑V3.1‑Terminus: официальный релиз с гибридной архитектурой (рассуждения + быстрый режим), улучшенным вызовом инструментов и поддержкой агентных сценариев; впоследствии заменён линейкой V3.2.
  • 2025-09-29 — DeepSeek‑V3.2‑Exp (экспериментальная версия): запуск экспериментальной версии с более чем 50% снижением стоимости за счёт DeepSeek Sparse Attention (DSA) и ускорением в 2–3 раза для длинных контекстов; позже заменена официальной V3.2.
  • 2025-12-01 — DeepSeek‑V3.2 (официальная версия): запуск V3.2 с режимом рассуждений и поддержкой вызова инструментов; обновление моделей API (deepseek-chat и deepseek-reasoner) и веб‑сервисов/приложений до V3.2 без изменения интерфейсов.
  • 2025-12-01 — DeepSeek‑V3.2‑Speciale: выпуск открытого высокоинтенсивного варианта, ориентированного на максимально глубокие рассуждения; использует DSA и масштабное RL‑дообучение, достигает результатов уровня золотых медалей на IMO/IOI/ICPC; модель опубликована с открытыми весами под MIT.
  • 2026-04-24 — DeepSeek‑V4 (V4‑Flash и V4‑Pro): запуск нового семейства Mixture of Experts (смесь экспертов)‑моделей с контекстом 1M токенов, гибридным вниманием (CSA+HCA), режимами thinking/без рассуждений и улучшенной эффективностью на длинных контекстах; V4‑Flash — быстрый и дешёвый вариант, V4‑Pro — флагманский вариант с рассуждениями с 1.6 трлн параметров (49B активных).

Модели (API)

ID (для API) Тип / режим Контекст Кратко Поддержка / ограничения Цены ($/1M) Документация
deepseek-v4-flash Чат / общий (V4‑Flash, обычный + режим рассуждений) до ~1 000 000 токенов контекста Быстрая и дешевая модель общего назначения семейства DeepSeek‑V4. Mixture of Experts (смесь экспертов)‑архитектура (около 284B параметров, 13B активных) с гибридным вниманием CSA+HCA, оптимизирована под массовые нагрузки, длинные контексты и код; поддерживает как обычный режим, так и режим рассуждений с явными рассуждениями.
  • Совместима с /chat/completions в OpenAI‑формате; достаточно сменить base_url и model.
  • JSON‑вывод: да; функция response_format={"type": "json_schema"} и аналогичные режимы поддерживаются.
  • Вызов функций / вызовы инструментов: полная поддержка, включая работу в режим рассужденийе.
  • Префикс чата / автодополнение и FIM: доступны в обычном (без рассуждений) режиме, используются для автодополнения кода и текстов.
  • Режим рассуждений: управляется через параметры reasoning (например, reasoning_effort) и extra_body={"thinking": {"type": "enabled"}}; ход рассуждений отдаётся через reasoning_content (включая стриминг).
  • Идентификаторы deepseek-chat и deepseek-reasoner теперь маршрутизируются на V4‑Flash (соответственно без рассуждений и thinking‑варианты) и помечены как легаси‑алиасы для обратной совместимости.
вход: $0.14; вход (кэш‑хит): ~$0.0028; выход: $0.28 V4‑Flash (спецификация)
deepseek-v4-pro Рассуждающая (V4‑Pro, усиленный режим рассуждений) до ~1 000 000 токенов контекста; до ~384K токенов вывода Флагманская рассуждающая модель с 1.6 трлн параметров и 49B активных; Mixture of Experts (смесь экспертов)‑архитектура с гибридным вниманием, ориентирована на сложное программирование, многошаговые агентные цепочки и глубокие STEM‑задачи. Поддерживает уровни рассуждений (non‑think / high / max) и даёт вышее качество, чем V3.2 и V4‑Flash, особенно в режиме Max.
  • JSON‑вывод и вызов функций: поддерживаются, включая сочетание с режим рассужденийом и потоковой выдачей reasoning_content + content.
  • Режимы рассуждений: non‑think (быстрый), think high (баланс глубины и скорости) и think max (максимальная глубина рассуждений; очень токеноёмкий).
  • Формат вывода: цепочка рассуждений окружена тегами <think>...</think>, за которыми следует финальный ответ; в non‑think‑режиме thinking‑блок опускается.
  • Изначально стоил $1.74/$3.48 за 1M токенов, но с апреля–мая 2026 года 75% скидка сделана постоянной, и теперь стандартные цены — $0.435 за вход и $0.87 за выход, с сильно удешевлёнными кэш‑хитами.
  • Демонстрирует уровень GPQA Diamond ~90.1 в Max‑режиме и сильные результаты на кодинговых и агентных бенчмарках (LiveCodeBench, SWE‑bench и др.).
вход: $0.435; вход (кэш‑хит): ~$0.0036; выход: $0.87 (долгосрочная «скидка» сделана постоянной) V4‑Pro (карточка модели)
Примечание: исторические модели DeepSeek‑V3.x и R1 по‑прежнему доступны как открытые веса (включая DeepSeek‑V3.2 и V3.2‑Speciale), но в облачном API основными точками входа стали deepseek-v4-flash и deepseek-v4-pro; легаси‑идентификаторы deepseek-chat и deepseek-reasoner маршрутизируются на V4‑Flash и помечены к постепенной деприкации, поэтому для новых проектов рекомендуется сразу использовать V4‑идентификаторы.

Ключевые особенности

  • Совместимый с OpenAI формат API: доступ через /chat/completions, можно использовать официальные OpenAI‑SDK и большинство совместимых клиентов при указании base_url=https://api.deepseek.com и корректного model.
  • Гибридное разрежённое внимание DeepSeek (DSA, CSA/HCA в V4): сильно снижает вычислительную стоимость и объём KV‑кэша на длинных контекстах; при контексте 1M DeepSeek‑V4‑Pro требует около 27% FLOPs и 10% KV‑кэша по сравнению с V3.2.
  • Гибридная архитектура V4: единая модель поддерживает как быстрый non‑режим рассуждений, так и глубокие режимы рассуждений (high/max), переключаемые параметрами запроса; это позволяет выбирать баланс между скоростью и качеством в зависимости от задачи.
  • Режим рассуждений (Thinking Mode) с явным полем reasoning_content и тэгами <think>...</think>; ход рассуждений можно получать и стримить отдельно от пользовательского ответа, использовать для отладки, оценки и агентных сценариев.
  • JSON‑режим и вызов функций поддерживаются как в обычном режиме, так и при активном режим рассужденийе, с полноценной передачей tool_calls и аргументов, что упрощает построение агентов и интеграцию с инструментами.
  • Полностью открытые веса под MIT для DeepSeek‑R1, V3.2‑Speciale и семейства V4 (Flash/Pro), с доступными дистиллятами (например, на базе Qwen и Llama) для более лёгкого локального развёртывания.
  • Потоковая передача, кэширование контекста и отдельные тарифы для кэш‑хитов (до 98% скидки для V4‑Flash); это существенно снижает стоимость типичных рабочих нагрузок с повторяющимися частями промпта.
  • Сильный упор на рассуждения и математику: линейка V3.2‑Speciale и V4‑Pro демонстрирует результаты уровня золотых медалей на олимпиадах IMO/IOI/ICPC и конкурентный уровень с GPT‑5.x/Claude/Gemini‑3.x на GPQA Diamond, HumanEval и других reasoning‑бенчмарках.

Рекомендации по применению

  • DeepSeek‑V4‑Flash: основной «рабочий» вариант для ассистентов и чат‑ботов общего назначения, структурированного вывода (JSON), интеграций через OpenAI‑совместимые SDK, массовой обработки текста и кода при низкой цене; хорошо подходит как дефолтная модель для продуктов, где критичны цена и пропускная способность, но не требуется максимально глубокое рассуждение.
  • DeepSeek‑V4‑Pro: задачи, критичные к качеству рассуждений — сложная математика, продвинутое программирование, многошаговое планирование, агентные сценарии, где модель может «думать» в режиме Think High/Max; оправдывает более высокую цену на токен при задачах, требующих надёжной логики и долгих цепочек рассуждений.
  • Открытые модели V3.2 / V3.2‑Speciale / R1 (локально): сценарии, где нужен полный контроль над данными и инфраструктурой или запрещены внешние API; эксперименты с архитектурой и дообучением, а также внутренние системы с повышенными требованиями к приватности.

Ограничения и риски

  • Режимы с максимальными рассуждениями (V4‑Pro Max, глубокий thinking у V4‑Flash) резко увеличивают расход токенов: в независимых оценках V4‑Pro Max тратит в разы больше выходных токенов, чем средний открытые веса конкурент, что критично для большого потока запросов без контроля длины ответа.
  • В режим рассужденийе часть параметров генерации и настройки стиля может интерпретироваться иначе или иметь меньшее влияние; поведение модели становится более детерминированным, но менее гибким по формату ответа.
  • Базовые наборы знаний моделей V3.2/V4, согласно публичным материалам, в основном охватывают данные до примерно 2024–начала 2025 годов; для более свежей информации требуется встроенный поиск или внешние источники знаний.
  • Глубокие цепочки рассуждений могут быть избыточны для простых задач: модель склонна подробно расписывать ход мысли, что удорожает и замедляет ответы; для тривиальных и средних по сложности случаев рекомендуется использовать обычный (без рассуждений) режим V4‑Flash.
  • Юридические и регуляторные аспекты: базирование компании в Китае (Ханчжоу) может требовать отдельной оценки рисков (особенно для корпоративных клиентов с жёсткими требованиями по юрисдикции и передаче данных).
  • Как и другие крупные LLM, V4‑Flash/V4‑Pro подвержены галлюцинациям; для V4‑Pro известно, что на бенчмарках «omniscience» модель часто отвечает даже при отсутствии знаний, а не отказывается, что требует дополнительных слоёв валидации и проверки фактов.

Сравнение цен

Чат (подписка)

Провайдер План / уровень Цена (как в официальном/агрегированном источнике) Ссылка
DeepSeek Веб‑чат / мобильное приложение Бесплатно; нет обязательных платных уровней для пользовательского чата, используется политика добросовестное использование (ограничения по нагрузке). страница
OpenAI ChatGPT Plus $20 / месяц (типичный тариф для премиум‑доступа к GPT‑5.x). цены
Anthropic Claude Pro $20 / месяц (при помесячной оплате). цены
Google Gemini AI Pro (Google One) $19.99 / месяц. цены

API (модели)

Провайдер Модель / ID вход (кэш‑хит), $/1M вход (без кэша), $/1M выход, $/1M Примечания Ссылка
DeepSeek deepseek-v4-flash $0.0028 $0.14 $0.28 Дешёвый и быстрый рабочий «флэш»‑вариант с 1M контекстом и thinking/non‑режим рассужденийами. цены
DeepSeek deepseek-v4-pro ~$0.0036 $0.435 $0.87 Флагманский вариант с рассуждениями; 75% первоначальной скидки закреплено как постоянное снижение цен. цены
DeepSeek (легаси) deepseek-chat / deepseek-reasoner см. V4‑Flash см. V4‑Flash см. V4‑Flash Легаси‑алиасы, теперь маршрутизируются на V4‑Flash (соответственно без рассуждений и thinking‑варианты) и помечены к деприкации. документация
OpenAI gpt-5 — (кэш расценивается отдельно) $1.25 $10.00 Флагманская модель GPT‑5, 400K контекст; цены по данным актуальных калькуляторов/документации. цены
Anthropic Claude Sonnet 4.5 $3.00 $15.00 Модель среднего уровня; цены по состоянию на 2026 год. цены
Google gemini-2.5-flash $0.30 $2.50 Быстрая модель с длинным контекстом; цены по официальной документации. цены

Бенчмарки (официальные и независимые; 2025–2026)

Провайдер Модель / ID MMLU MMLU Pro GPQA Diamond HumanEval AIME / MATH (если указано) Источник
DeepSeek DeepSeek‑V4‑Flash (базовая версия) ~88.7% ~68.3% ~69.5% DeepInfra обзор V4
DeepSeek DeepSeek‑V4‑Pro (базовая версия) ~90.1% ~73.5% — (Max: ~90.1%) ~76.8% DeepInfra обзор V4
DeepSeek DeepSeek‑V3.2 (базовая версия) ~87.8% ~65.5% ~75.1% ~62.8% цены/бенчмарки V3.2
DeepSeek DeepSeek‑V3.2‑Speciale золотой уровень на IMO/IOI/ICPC; MATH≈92%, HumanEval≈90% (по техническому отчёту) отчёт V3.2
DeepSeek DeepSeek‑R1 ~90.8% ~84.0% ~71.5% ~92.4% AIME 2024: 79.8% (Pass@1), 86.7% (self‑consistency) DeepSeek‑R1
OpenAI GPT‑5 ~92–93% ~85–93% (зависит от версии) ~93–94% аналитика GPT‑5.2
Anthropic Claude Sonnet 4.5 ~90% (по независимым сводкам) ~83–85% ~90%+ ценовой/бенчмарк‑агрегатор

Обновления июня 2026

  • DeepSeek‑V4 (Flash/Pro) стал основной линейкой API: V4‑Flash заменяет V3.2 как дешёвый «рабочий» вариант, а V4‑Pro — как флагман класса рассуждающих моделей; легаси‑идентификаторы deepseek-chat и deepseek-reasoner маршрутизируются на V4‑Flash и помечены для вывода из оборота.
  • Долгосрочное снижение цен на V4‑Pro: 75% промо‑скидка, действовавшая до конца мая 2026 года, сделана постоянной; итоговая цена V4‑Pro — $0.435/$0.87 за 1M токенов, что делает модель одним из самых дешёвых открытых флагманов класса рассуждающих моделей на рынке.
  • Укрепление позиций в бенчмарках: независимые обзоры подтверждают, что V4‑Pro Max конкурирует с GPT‑5.4, Claude Opus 4.6/4.7 и Gemini‑3.1‑Pro на задачах GPQA Diamond, LiveCodeBench и SWE‑bench Verified, при этом остаётся существенно дешевле по цене за токен.
  • Локальная экосистема V4: V4‑Flash и V4‑Pro появились в экосистемах Ollama, NVIDIA NIM, VS Code/JetBrains‑плагинах и как INT4‑/INT8‑квантизованные сборки на Hugging Face, что упрощает локальное и гибридное развёртывание.
  • Бесплатный веб‑чат и тестовый API: DeepSeek продолжает предлагать бесплатный веб‑чат и разовый грант на 5M токенов для новых API‑аккаунтов, что делает платформу привлекательной для разработчиков и небольших команд.