Оглавление
Китайская лаборатория искусственного интеллекта DeepSeek неожиданно вышла в топ рейтингов Apple App Store и Google Play, сместив с первых позиций ChatGPT. Этот взлет заставил аналитиков с Уолл-стрит и технологических лидеров задуматься о способности США сохранять лидерство в гонке ИИ и о перспективах спроса на чипы для искусственного интеллекта.
Финансовые корни технологического прорыва
DeepSeek поддерживается High-Flyer Capital Management — китайским хедж-фондом, использующим ИИ для торговых решений. Сооснователь фонда Лян Вэньфэн, увлекшийся трейдингом еще во время учебы в Университете Чжэцзяна, запустил High-Flyer Capital Management в 2019 году с фокусом на разработку и внедрение алгоритмов искусственного интеллекта.
В 2023 году High-Flyer создал DeepSeek как исследовательскую лабораторию, отдельную от финансового бизнеса. При поддержке фонда лаборатория выделилась в независимую компанию под тем же названием.
С первого дня DeepSeek строил собственные дата-центры для обучения моделей. Однако, как и другие китайские компании в сфере ИИ, DeepSeek столкнулся с ограничениями экспорта аппаратного обеспечения из США. Для обучения одной из последних моделей компании пришлось использовать чипы Nvidia H800 — менее мощную версию чипа H100, доступного американским компаниям.
Техническое превосходство и ограничения
DeepSeek представил первые модели — DeepSeek Coder, DeepSeek LLM и DeepSeek Chat — в ноябре 2023 года. Однако настоящий перелом произошел весной прошлого года с выпуском семейства моделей DeepSeek-V2 нового поколения.
DeepSeek-V2, система общего назначения для анализа текста и изображений, показала выдающиеся результаты в различных тестах ИИ — и была значительно дешевле в эксплуатации, чем сопоставимые модели того времени. Это заставило внутренних конкурентов DeepSeek, включая ByteDance и Alibaba, снизить цены на использование некоторых своих моделей и сделать другие полностью бесплатными.
DeepSeek-V3, запущенный в декабре 2024 года, только усилил известность компании. Согласно внутренним тестам DeepSeek, V3 превосходит как доступные для загрузки открытые модели, такие как Meta Llama, так и «закрытые» модели, доступные только через API, такие как GPT-4o от OpenAI.
Не менее впечатляющей является модель рассуждений R1 от DeepSeek. Выпущенная в январе, по заявлениям компании, R1 показывает результаты не хуже модели o1 от OpenAI по ключевым тестам.
Будучи моделью рассуждений, R1 фактически проверяет себя, что помогает избежать некоторых типичных ошибок. Модели рассуждений требуют немного больше времени — обычно от секунд до минут — для поиска решений по сравнению с обычными моделями. Преимущество в том, что они склонны быть более надежными в таких областях, как физика, наука и математика.
Феномен DeepSeek демонстрирует, что технологическое лидерство больше не является монополией Кремниевой долины. Китайские разработчики смогли создать конкурентоспособные модели, несмотря на аппаратные ограничения, что говорит о растущей зрелости экосистемы. Однако политические ограничения на ответы моделей остаются серьезным барьером для глобального распространения — в отличие от западных аналогов, эти системы не могут обсуждать определенные исторические и политические темы.
Рыночное влияние и перспективы
У моделей R1, DeepSeek V3 и других моделей DeepSeek есть и обратная сторона. Будучи ИИ китайской разработки, они проходят тестирование интернет-регулятором Китая, чтобы гарантировать, что их ответы «воплощают основные социалистические ценности». В чат-боте DeepSeek, например, R1 не будет отвечать на вопросы о площади Тяньаньмэнь или автономии Тайваня.
В марте DeepSeek превысил отметку в 16,5 миллионов посещений. «В марте DeepSeek занял второе место, несмотря на падение трафика на 25% по сравнению с февралем по ежедневным посещениям», — сообщил TechCrunch Дэвид Карр, редактор Similarweb. Это все еще бледнеет по сравнению с ChatGPT, который в марте превысил отметку в 500 миллионов еженедельных активных пользователей.
В мае DeepSeek выпустил обновленную версию своей модели рассуждений R1 на платформе для разработчиков Hugging Face.
По материалам TechCrunch.
Оставить комментарий