Оглавление
Еще один день конца 2025 года — еще один впечатляющий результат от китайской компании в сфере открытого искусственного интеллекта. Социальная сеть Weibo представила модель VibeThinker-1.5B с 1,5 миллиардами параметров, которая является доработанной версией модели Alibaba Qwen2.5-Math-1.5B.
Модель доступна для бесплатного скачивания и использования исследователями и разработчиками — даже в коммерческих целях — под либеральной лицензией MIT на Hugging Face, GitHub и ModelScope, с техническим отчетом на arXiv.org.
Невероятная эффективность при минимальных затратах
Несмотря на компактный размер, VibeThinker-1.5B демонстрирует рекордные результаты в задачах на логическое мышление, математику и программирование, превосходя модели в сотни раз больше. Она обошла даже знаменитую модель DeepSeek R1 с 671 миллиардами параметров на специализированных бенчмарках.
Модель также превзошла Mistral AI Magistral Medium и сравнялась с Anthropic Claude Opus 4 и OpenAI gpt-oss-20B Medium, при этом требуя лишь доли инфраструктурных затрат и инвестиций.
Самое впечатляющее — стоимость пост-обучения составила всего $7800 (3900 часов GPU на Nvidia H800), что в десятки раз меньше типичных затрат на дообучение моделей сопоставимого или большего масштаба.
Это тот случай, когда инновационный подход к обучению оказывается важнее грубой вычислительной мощности. Китайские разработчики демонстрируют, что можно достичь выдающихся результатов без миллионных бюджетов — урок, который западным компаниям стоило бы усвоить.
Секрет успеха: принцип Spectrum-to-Signal
Производительность VibeThinker-1.5B обусловлена не масштабом, а тренировочным фреймворком Spectrum-to-Signal Principle (SSP). Вместо оптимизации исключительно для правильности единичного ответа, SSP разделяет обучение с учителем и обучение с подкреплением на две фазы с разными целями:
- Фаза спектра (SFT): модель обучается максимизировать разнообразие потенциально правильных ответов, улучшая показатель Pass@K
- Фаза сигнала (RL): система обучения с подкреплением (MaxEnt-Guided Policy Optimization) идентифицирует и усиливает наиболее корректные пути из этого разнообразного пула решений
Авторы утверждают, что такое разделение позволяет малым моделям более эффективно исследовать пространство логических рассуждений.
Сравнительная производительность
Несмотря на скромные размеры, VibeThinker-1.5B демонстрирует кросс-доменное логическое мышление, превосходящее многие более крупные модели:
| Модель | AIME25 | LiveCodeBench v6 | GPQA-Diamond |
|---|---|---|---|
| VibeThinker-1.5B | 74.4 | 51.1 | 46.7 |
| GPT-OSS-20B-Medium | 72.1 | 54.9 | 66.0 |
| Claude Opus 4 | 69.2 | 56.6 | 79.6 |
| MiniMax M1 (456B) | 74.6 | 62.3 | 69.2 |
| DeepSeek R1 (671B) | 70.0 | 65.9 | 71.5 |
| Kimi K2 (1.09T) | 49.5 | 53.7 | 75.1 |
На математических тестах AIME24 модель превзошла Kimi K2 (1,09 триллиона параметров) более чем на 10 пунктов (80,3 против 69,6). На LiveCodeBench v6 она обошла Claude Opus 4 (51,1 против 47,4). На GPQA результат удвоился по сравнению с базовой моделью (с 16,4 до 46,7).
Практическое применение и развертывание
Релиз включает рекомендуемые настройки для инференса: температура = 0,6, top_p = 0,95, максимальное количество токенов = 40960.
Модель достаточно мала для развертывания на периферийных устройствах, включая мобильные телефоны и автомобильные встроенные системы. Стоимость инференса оценивается в 20-70 раз дешевле, чем у крупных моделей.
Это позиционирует VibeThinker-1.5B не только как исследовательское достижение, но и как потенциальную основу для экономически эффективных локально развертываемых систем логического вывода.
Стратегия Weibo на рынке ИИ
Запущенная Sina Corporation в 2009 году, Weibo остается краеугольным камнем китайской экосистемы социальных медиа. Несмотря на 600 миллионов ежемесячных активных пользователей (более чем вдвое больше, чем у X), инвесторы не оптимистичны относительно потенциала роста рекламных доходов в ближайшей перспективе.
Weibo сталкивается с усиливающейся конкуренцией со стороны видеоплатформ вроде Douyin, которые привлекают молодых пользователей. В ответ компания делает ставку на монетизацию экономики создателей, прямые трансляции и вертикальное видео.
Платформа также находится под пристальным вниманием регуляторов. В сентябре 2025 года Weibo была среди платформ, получивших официальные предупреждения, что подчеркивает ее постоянную подверженность политическим рискам.
Рывок Weibo в исследованиях ИИ, примером которого является выпуск VibeThinker-1.5B, сигнализирует о смене амбиций. Помимо статуса медиаплатформы, Weibo позиционирует себя как технологическая компания, способная конкурировать на глобальной арене ИИ.
По материалам VentureBeat.
Оставить комментарий