По сообщению Ars Technica, китайская компания DeepSeek вынуждена перенести релиз своей новой языковой модели. Причина — неудовлетворительная производительность отечественных чипов, на которые компания перешла из-за экспортных ограничений США.
Технические сложности
Инженеры DeepSeek столкнулись с падением эффективности обучения нейросетей на 40-60% по сравнению с NVIDIA A100 при использовании китайских аналогов. Особенно критичными стали проблемы с:
- Скоростью передачи данных между чипами
- Стабильностью работы при длительных вычислениях
- Поддержкой библиотек для распределённых вычислений
Геополитический контекст
После ужесточения экспортного контроля США в 2024 году китайские разработчики ИИ активно переходят на чипы Huawei Ascend и других локальных производителей. Однако разрыв в производительности остаётся существенным — особенно для тренировки моделей уровня GPT-4 и выше.
Это не просто техническая заминка, а тревожный сигнал для всей экосистемы. Даже топовые китайские чипы пока проигрывают в энергоэффективности и стабильности западным аналогам. Временное решение — оптимизация алгоритмов под железо, но это тупиковый путь. Реальный прорыв потребует либо снятия санкций (маловероятно), либо квантового скачка в местном чипмейкинге. Пока же компании будут вынуждены либо мириться с отставанием, либо искать серые схемы импорта.
Официально DeepSeek заявил о «корректировке сроков для достижения целевых показателей качества». По данным инсайдеров, задержка составит минимум 6 месяцев.
Оставить комментарий