Рынок аппаратного обеспечения для искусственного интеллекта входит в фазу тектонического сдвига: на смену гонке мощностей для обучения моделей приходит эра инференса — исполнения готовых алгоритмов. Как сообщает издание The Wall Street Journal, это изменение станет центральной темой ежегодной конференции GTC в Сан-Хосе, ставя под вопрос долгосрочную устойчивость монополии Nvidia.
До сих пор Nvidia удерживала статус самой дорогой публичной компании мира благодаря своим GPU, которые идеально подходят для параллельных вычислений при тренировке нейросетей. Однако индустрия взрослеет: клиенты всё меньше озабочены созданием гигантских моделей «с нуля» и всё больше — их монетизацией через обслуживание конечных пользователей.
Технологический переход от обучения к исполнению
Инференс требует принципиально иного подхода к архитектуре чипов. Если при обучении критически важна сырая вычислительная мощь, то для работы агентов и чат-ботов на первый план выходят энергоэффективность, скорость интерконнекта и пропускная способность памяти. В этой нише позиции Nvidia уже не выглядят столь незыблемыми, так как на рынок выходят специализированные решения, оптимизированные под конкретные задачи генерации токенов.
Глава корпорации Дженсен Хуанг публично признал неизбежность этого процесса. По его словам, 2026 год станет моментом, когда инференс окончательно «поглотит» ИИ-индустрию. Основным драйвером выступает переход к агентному ИИ — системам, которые не просто генерируют текст, но активно используют инструменты, работают с файлами и выполняют сложные цепочки действий.
«Инфлексия, которую мы наблюдаем, долгое время была очевидной — это способность ИИ использовать инструменты и получать доступ к данным. Популярные агенты вроде Claude Code генерируют в тысячи раз больше токенов инференса, чем их предшественники, создавая колоссальный спрос на специализированные мощности», — говорит Дженсен Хуанг
Стратегические риски и рыночная ирония
Рост спроса на вычисления при исполнении моделей создает парадоксальную ситуацию для Nvidia. С одной стороны, объемы заказов растут, с другой — это открывает окно возможностей для конкурентов и собственных разработок техгигантов (ASIC), которые могут быть эффективнее универсальных графических процессоров в узких задачах вывода.
Инженерное изящество архитектуры Hopper не отменяет того факта, что Nvidia пытается забивать гвозди микроскопом, адаптируя тяжелые тренировочные GPU под задачи легковесного инференса. Пока рынок прощает избыточность ради скорости внедрения, но переход к агентному ИИ неизбежно выявит неэффективность универсальных решений. Без радикального пересмотра энергопотребления и себестоимости одного токена Nvidia рискует превратиться в «золотой стандарт» прошлого, уступив место узкоспециализированным кристаллам.
Для таких компаний, как OpenAI и Anthropic, стоимость генерации каждого токена становится определяющим фактором маржинальности бизнеса. В условиях, когда вычисления требуются постоянно и в огромных масштабах, зависимость от дорогостоящих и энергозатратных GPU становится стратегической уязвимостью, которую рынок попытается устранить в ближайшие два года.
Оставить комментарий