Оглавление

Анонимный стартап Nous Research, ставший одним из лидеров движения за открытый искусственный интеллект, представил семейство языковых моделей Hermes 4. Эти модели, по заявлениям разработчиков, не уступают по производительности коммерческим системам, но при этом предлагают пользователям беспрецедентный контроль и минимальные ограничения на контент.

Анонс модели Hermes 4 с графиком и метриками производительности
Источник: www.venturebeat.com

Гибридное мышление Hermes 4: прозрачность против черного ящика

Ключевая особенность Hermes 4 — технология «гибридного мышления», позволяющая пользователям переключаться между быстрыми ответами и глубоким пошаговым анализом. При активации этого режима модели генерируют внутренние рассуждения в специальных тегах <think> перед финальным ответом — аналогично OpenAI o1, но с полной прозрачностью мыслительного процесса.

Технические результаты впечатляют: крупнейшая модель на 405 миллиардов параметров показала 96,3% на математическом бенчмарке MATH-500 и 81,9% на сложном конкурсе AIME’24 — результаты, сопоставимые с коммерческими системами, разработка которых обходится в миллионы долларов.

График сравнения Hermes 4 с конкурентами по проценту ответов на RefusalBench
Источник: www.venturebeat.com

Прозрачность процесса рассуждений — это серьезный шаг вперед, но именно отсутствие ограничений делает Hermes 4 одновременно прорывом и потенциальной проблемой. Модель с 57% отказов против 17% у GPT-4o — это не просто техническое достижение, это философский манифест против цензуры в ИИ. Вопрос в том, кто будет нести ответственность, когда неограниченный ИИ начнет генерировать действительно опасный контент.

DataForge и Atropos: инновационные системы обучения

За выдающимися возможностями Hermes 4 стоят две революционные системы обучения:

  • DataForge — генератор синтетических данных на основе графов, преобразующий простые данные в сложные примеры для обучения
  • Atropos — фреймворк обучения с подкреплением с сотнями специализированных сред обучения

DataForge использует «случайные блуждания» по направленным графам, превращая, например, статью из Википедии в рэп-композицию с последующей генерацией вопросов и ответов. Atropos же обеспечивает обучение через «отбор с отклонением» — модели получают обратную связь только при правильных решениях, что гарантирует высочайшее качество тренировочных данных.

Этот релиз знаменует эскалацию в борьбе между открытым и проприетарным ИИ, где вопрос контроля над искусственным интеллектом становится центральным. В то время как крупные технологические гиганты наращивают ограничения, открытые проекты вроде Hermes 4 бросают вызов самой философии «безопасного» ИИ.

По материалам VentureBeat.