Оглавление

К 2030 году стоимость эксплуатации крупномасштабных языковых моделей с триллионами параметров упадет более чем на 90% по сравнению с текущими показателями. Согласно прогнозу аналитического агентства Gartner, технологический стек ИИ станет до 100 раз эффективнее, чем решения образца 2022 года. Однако это «ценовое пике» может оказаться иллюзорным для конечного бизнеса из-за взрывного роста сложности выполняемых задач.

Драйверами дефляции в сегменте вычислений станут не только итерации полупроводников, но и комплексная оптимизация: от специализированных архитектур чипов до более эффективного использования инфраструктуры дата-центров. Ожидается, что существенную часть нагрузки заберут на себя edge computing и специализированный кремний, заточенный исключительно под инференс, что радикально снизит удельную стоимость обработки одного токена.

Ловушка агентских систем

Несмотря на оптимистичные цифры удельной стоимости, общие затраты предприятий на ИИ могут не только не снизиться, но и вырасти. Аналитик Gartner Will Sommer отмечает, что на смену простым чат-ботам приходят «агентские» модели. Эти системы способны автономно выполнять многоступенчатые цепочки действий, что требует в 5–30 раз больше токенов на одну бизнес-задачу по сравнению с классическими текстовыми запросами.

Таким образом, прогресс в эффективности оборудования будет нивелирован аппетитами софта. Рынок движется в сторону высокоуровневых систем рассуждений, которые по определению остаются дефицитными и ресурсоемкими. Даже при наличии дешевых вычислительных мощностей, доступ к наиболее продвинутым «фронтирным» моделям сохранит высокую ценовую планку для корпоративного сектора.

Индустрия ИИ мастерски продает нам веру в бесконечную масштабируемость при падающих костах, забывая уточнить, что архитектурная избыточность агентских систем съедает любую экономию на транзисторах. Мы наблюдаем классический парадокс Джевонса: рост эффективности использования ресурса лишь увеличивает его общее потребление. Технологический стек станет дешевле, но потребность в «умных» вычислениях вырастет экспоненциально, оставляя бюджеты CIO в заложниках у собственной инфраструктуры. Истинная ценность сместится от владения мощностями к умению ими филигранно дирижировать.

Стратегическая адаптация архитектур

В новых условиях ключевым навыком для ИТ-директоров станет интеллектуальное распределение нагрузки. Gartner рекомендует отходить от использования универсальных тяжелых моделей для всех типов задач. Вместо этого выигрышными окажутся платформы, способные маршрутизировать рутинные высокообъемные операции на компактные специализированные модели, оставляя дорогие вычисления для критически важных узлов.

Эксперты предупреждают, что неэффективная системная архитектура, замаскированная сегодня временно низкими ценами на токены, станет критическим барьером при масштабировании. Продуктовым лидерам следует фокусироваться на оптимизации логики взаимодействия систем, иначе грядущее удешевление инференса останется лишь статистическим фактом в отчетах поставщиков облачных услуг, не принося реальной прибыли бизнесу.