Оглавление

Еще один день конца 2025 года — еще один впечатляющий результат от китайской компании в сфере открытого искусственного интеллекта. Социальная сеть Weibo представила модель VibeThinker-1.5B с 1,5 миллиардами параметров, которая является доработанной версией модели Alibaba Qwen2.5-Math-1.5B.

Модель доступна для бесплатного скачивания и использования исследователями и разработчиками — даже в коммерческих целях — под либеральной лицензией MIT на Hugging Face, GitHub и ModelScope, с техническим отчетом на arXiv.org.

Невероятная эффективность при минимальных затратах

Несмотря на компактный размер, VibeThinker-1.5B демонстрирует рекордные результаты в задачах на логическое мышление, математику и программирование, превосходя модели в сотни раз больше. Она обошла даже знаменитую модель DeepSeek R1 с 671 миллиардами параметров на специализированных бенчмарках.

Модель также превзошла Mistral AI Magistral Medium и сравнялась с Anthropic Claude Opus 4 и OpenAI gpt-oss-20B Medium, при этом требуя лишь доли инфраструктурных затрат и инвестиций.

Самое впечатляющее — стоимость пост-обучения составила всего $7800 (3900 часов GPU на Nvidia H800), что в десятки раз меньше типичных затрат на дообучение моделей сопоставимого или большего масштаба.

Это тот случай, когда инновационный подход к обучению оказывается важнее грубой вычислительной мощности. Китайские разработчики демонстрируют, что можно достичь выдающихся результатов без миллионных бюджетов — урок, который западным компаниям стоило бы усвоить.

Секрет успеха: принцип Spectrum-to-Signal

Производительность VibeThinker-1.5B обусловлена не масштабом, а тренировочным фреймворком Spectrum-to-Signal Principle (SSP). Вместо оптимизации исключительно для правильности единичного ответа, SSP разделяет обучение с учителем и обучение с подкреплением на две фазы с разными целями:

  • Фаза спектра (SFT): модель обучается максимизировать разнообразие потенциально правильных ответов, улучшая показатель Pass@K
  • Фаза сигнала (RL): система обучения с подкреплением (MaxEnt-Guided Policy Optimization) идентифицирует и усиливает наиболее корректные пути из этого разнообразного пула решений

Авторы утверждают, что такое разделение позволяет малым моделям более эффективно исследовать пространство логических рассуждений.

Сравнительная производительность

Несмотря на скромные размеры, VibeThinker-1.5B демонстрирует кросс-доменное логическое мышление, превосходящее многие более крупные модели:

Модель AIME25 LiveCodeBench v6 GPQA-Diamond
VibeThinker-1.5B 74.4 51.1 46.7
GPT-OSS-20B-Medium 72.1 54.9 66.0
Claude Opus 4 69.2 56.6 79.6
MiniMax M1 (456B) 74.6 62.3 69.2
DeepSeek R1 (671B) 70.0 65.9 71.5
Kimi K2 (1.09T) 49.5 53.7 75.1

На математических тестах AIME24 модель превзошла Kimi K2 (1,09 триллиона параметров) более чем на 10 пунктов (80,3 против 69,6). На LiveCodeBench v6 она обошла Claude Opus 4 (51,1 против 47,4). На GPQA результат удвоился по сравнению с базовой моделью (с 16,4 до 46,7).

Практическое применение и развертывание

Релиз включает рекомендуемые настройки для инференса: температура = 0,6, top_p = 0,95, максимальное количество токенов = 40960.

Модель достаточно мала для развертывания на периферийных устройствах, включая мобильные телефоны и автомобильные встроенные системы. Стоимость инференса оценивается в 20-70 раз дешевле, чем у крупных моделей.

Это позиционирует VibeThinker-1.5B не только как исследовательское достижение, но и как потенциальную основу для экономически эффективных локально развертываемых систем логического вывода.

Стратегия Weibo на рынке ИИ

Запущенная Sina Corporation в 2009 году, Weibo остается краеугольным камнем китайской экосистемы социальных медиа. Несмотря на 600 миллионов ежемесячных активных пользователей (более чем вдвое больше, чем у X), инвесторы не оптимистичны относительно потенциала роста рекламных доходов в ближайшей перспективе.

Weibo сталкивается с усиливающейся конкуренцией со стороны видеоплатформ вроде Douyin, которые привлекают молодых пользователей. В ответ компания делает ставку на монетизацию экономики создателей, прямые трансляции и вертикальное видео.

Платформа также находится под пристальным вниманием регуляторов. В сентябре 2025 года Weibo была среди платформ, получивших официальные предупреждения, что подчеркивает ее постоянную подверженность политическим рискам.

Рывок Weibo в исследованиях ИИ, примером которого является выпуск VibeThinker-1.5B, сигнализирует о смене амбиций. Помимо статуса медиаплатформы, Weibo позиционирует себя как технологическая компания, способная конкурировать на глобальной арене ИИ.

По материалам VentureBeat.