Задержка ИИ-модели DeepSeek из-за китайских чипов

Китайская компания DeepSeek откладывает выпуск новой языковой модели из-за низкой производительности отечественных чипов, что подчёркивает технологические сложности в условиях санкций.

Оглавление

Технические сложности
Геополитический контекст

По сообщению Ars Technica, китайская компания DeepSeek вынуждена перенести релиз своей новой языковой модели. Причина — неудовлетворительная производительность отечественных чипов, на которые компания перешла из-за экспортных ограничений США.

Технические сложности

Инженеры DeepSeek столкнулись с падением эффективности обучения нейросетей на 40-60% по сравнению с NVIDIA A100 при использовании китайских аналогов. Особенно критичными стали проблемы с:

Скоростью передачи данных между чипами
Стабильностью работы при длительных вычислениях
Поддержкой библиотек для распределённых вычислений

Геополитический контекст

После ужесточения экспортного контроля США в 2024 году китайские разработчики ИИ активно переходят на чипы Huawei Ascend и других локальных производителей. Однако разрыв в производительности остаётся существенным — особенно для тренировки моделей уровня GPT-4 и выше.

Это не просто техническая заминка, а тревожный сигнал для всей экосистемы. Даже топовые китайские чипы пока проигрывают в энергоэффективности и стабильности западным аналогам. Временное решение — оптимизация алгоритмов под железо, но это тупиковый путь. Реальный прорыв потребует либо снятия санкций (маловероятно), либо квантового скачка в местном чипмейкинге. Пока же компании будут вынуждены либо мириться с отставанием, либо искать серые схемы импорта.

Официально DeepSeek заявил о «корректировке сроков для достижения целевых показателей качества». По данным инсайдеров, задержка составит минимум 6 месяцев.

Новости

DeepSeek откладывает новую модель ИИ из-за проблем с китайскими чипами

Технические сложности

Геополитический контекст

Еще интереснее

Производитель памяти Crucial прекращает выпуск потребительской техники ради ИИ и дата-центров

AMD и PyTorch организовали эффективное обучение MoE-моделей на 1024 AMD GPU с TorchTitan

Дата-центры Amazon в Орегоне могут быть связаны с ростом заболеваемости раком

xAI строит солнечную электростанцию рядом с дата-центром, которая покроет лишь 10% его потребления

Оставить комментарий