На рынке открытых нейросетей произошло знаковое событие: компания Nvidia представила Nemotron 3 Ultra, которая, судя по свежим тестам, стала самой мощной open-source моделью, разработанной в США. Как сообщает издание The Decoder, новинка демонстрирует впечатляющее сочетание интеллекта и скорости, хотя пальма первенства в глобальном зачете всё еще остается за разработками из Поднебесной.

Архитектура Nemotron 3 Ultra базируется на внушительных 550 миллиардах параметров, однако инженеры применили механизм Mixture of Experts (MoE), благодаря которому в каждый момент времени активны лишь 55 миллиардов параметров. Такой подход позволяет достичь высокой точности ответов, не превращая инференс в бесконечное ожидание, что часто становится проблемой для тяжеловесных систем.

Согласно данным бенчмарка Artificial Analysis, новая разработка Nvidia набрала 48 баллов, оставив далеко позади других американских конкурентов с открытыми весами. Для сравнения, Gemma 4 31B набрала 39 баллов, а популярная gpt-oss-120b — всего 33. Впрочем, догнать китайскую Kimi K2.6, удерживающую результат в 54 балла, американской новинке пока не удалось.

Баланс между скоростью и интеллектом

Одной из наиболее любопытных характеристик Nemotron 3 Ultra стала её производительность на платформе DeepInfra. Модель выдает более 300 токенов в секунду, что выглядит почти вызывающе на фоне конкурентов от DeepSeek или Moonshot аналогичного размера, которые едва преодолевают порог в 50-100 токенов. Кажется, Nvidia удалось найти ту самую «золотую середину» в архитектурных настройках.

Лидерство Nvidia в железе ожидаемо трансформируется в софтверное преимущество, но Nemotron 3 Ultra — это скорее демонстрация мускулов перед инвесторами, чем реальный переворот. Высокая скорость генерации впечатляет, пока не вспоминаешь о доминировании китайских архитектур в эффективности рассуждений. Американский open-source наконец-то подал признаки жизни, но он всё еще в роли догоняющего по чистому качеству логики.

Официальный релиз модели запланирован на 4 июня. В этот день веса станут доступны на таких популярных площадках, как Hugging Face и OpenRouter. Это позволит разработчикам по всему миру интегрировать Nemotron в свои проекты и проверить, насколько синтетические тесты соответствуют реальным задачам, где дьявол, как известно, всегда кроется в деталях контекста.

Если рассматривать ситуацию шире, то Nemotron 3 Ultra попадает в так называемый «квадрант привлекательности» — зону, где высокая скорость работы сочетается с достойным уровнем «интеллекта». Однако разрыв с закрытыми проприетарными системами всё еще велик: текущий лидер Claude Opus 4.8 удерживает планку в 61 балл, напоминая нам, что за полную прозрачность кода всё еще приходится платить качеством результата.