Китайский технологический гигант Baidu анонсировал выпуск своей новой языковой модели Ernie 5.1, которая демонстрирует впечатляющий прогресс в области эффективности инфраструктуры ИИ. Согласно данным The Decoder, разработчикам удалось сократить расходы на предварительное обучение на 94% по сравнению с аналогичными по классу моделями, при этом система уверенно удерживает лидерство в китайских бенчмарках.
Модель была получена путем дистилляции из более масштабной предшественницы — Ernie 5.0. В результате оптимизации Ernie 5.1 получила примерно в три раза меньше общих параметров и около половины активных параметров на каждый запрос. Несмотря на «облегченную» архитектуру, в рейтинге Arena Search Leaderboard на 9 мая модель заняла четвертое место в мире, уступив лишь вариантам Claude Opus и GPT-5.5 Search.
Архитектурные хитрости и борьба с «эффектом качелей»
В основе разработки лежит фреймворк Once-For-All, который позволяет оптимизировать целое семейство моделей разного размера за один проход обучения. Это избавляет инженеров от необходимости проводить дорогостоящие циклы pre-training для каждой конфигурации отдельно. Baidu просто извлекла наиболее эффективную подмодель, используя уже накопленные вычислительные ресурсы Ernie 5.0.
Для тонкой настройки (fine-tuning) была применена четырехэтапная конвейерная обработка. Она призвана решить классическую проблему машинного обучения, известную как «эффект качелей», когда прогресс в написании кода внезапно ухудшает творческие способности модели. Процесс выглядит следующим образом:
- Стандартное обучение с учителем на широком наборе данных для формирования базы.
- Параллельное обучение экспертных моделей, специализирующихся на коде, логике и агентских задачах.
- Дистилляция знаний, где одна «ученическая» модель перенимает опыт у всех «учителей» одновременно.
- Финальное обучение с подкреплением (RL) для придания ответам естественности и вариативности.
Внутренние тесты компании показывают, что в задачах автономных агентов модель превосходит DeepSeek-V4-Pro, а в вопросах логики и общих знаний приближается к показателям Gemini 3.1 Pro от Google. Впрочем, проверить эти заявления на практике пока затруднительно.
Пока Baidu прячет архитектуру за облачным API, любые восторги по поводу бенчмарков стоит делить на два. Мы видим отличную оптимизацию под конкретные тесты, но отсутствие прозрачности превращает технологический прорыв в маркетинговое упражнение, где реальная универсальность приносится в жертву красивым графикам.
Доступность и практическое применение
На текущий момент Ernie 5.1 уже интегрирована в экосистему Baidu AI Studio и доступна через официальный сайт компании. Ожидается, что модель станет ядром для более чем десяти креативных платформ. Среди них — приложения для генерации коротких драм Storymaster, ролевые платформы и специализированные инструменты для создания визуального контента.
Несмотря на техническое изящество, стоит отметить, что веса модели остаются закрытыми. Это означает, что независимое сообщество не может верифицировать заявленную эффективность или исследовать возможные галлюцинации системы в нетипичных сценариях. Baidu продолжает следовать стратегии закрытой разработки, которая была задана еще в начале 2026 года при выпуске Ernie 5.0 с её 2,4 триллионами параметров.
Оставить комментарий