Оглавление

На конференции Mobile World Congress в Барселоне председатель совета директоров OpenAI Брет Тейлор озвучил цифры, которые наглядно демонстрируют агрессивную дефляцию в секторе генеративного ИИ. По его словам, за последние 18 месяцев стоимость эксплуатации передовых моделей упала в 100 раз, в то время как качественные показатели выросли на 50%.

Как сообщает Broadband Breakfast, такая динамика коренным образом меняет юнит-экономику клиентских сервисов. Тейлор прогнозирует, что стремительное удешевление технологии позволит снизить себестоимость одного автоматизированного звонка в службу поддержки до символического одного цента.

От GPT-4 к GPT-4o: деградация цены при росте метрик

Для иллюстрации технологического скачка Тейлор привел конкретные данные по прайсингу API. Три года назад флагманская модель GPT-4 обходилась разработчикам в 60 долларов за миллион выходных токенов. Сегодня актуальная GPT-4o стоит всего 60 центов за тот же объем данных, при этом демонстрируя значительно лучшие результаты в человеческих оценках и бенчмарках.

Стоит отметить, что Брет Тейлор совмещает пост в OpenAI с руководством стартапом Sierra, который специализируется на внедрении ИИ-агентов в корпоративный сектор. Опыт бывшего со-генерального директора Salesforce позволяет ему оценивать ИИ не как абстрактное чудо, а как конкретный рыночный инструмент, эффективность которого напрямую зависит от стоимости вычислений.

Стремительное падение стоимости токена — это впечатляющий инженерный триумф, но за фасадом доступности скрывается стратегическая ловушка. Пока OpenAI демпингует, реальный сектор все еще спотыкается о галлюцинации и сложности интеграции «агентов» в legacy-системы. Стократное удешевление не означает стократного роста ценности, если архитектура остается черным ящиком с непредсказуемым поведением в критических сценариях. Рынок получает дешевое топливо для двигателя, который все еще находится в стадии стендовых испытаний.

Рыночные последствия и операционные нюансы

Снижение барьера входа заставляет крупный бизнес пересматривать стратегии цифровой трансформации. Если раньше внедрение LLM требовало многомиллионных бюджетов на R&D и инфраструктуру, то текущие ценовые уровни делают автоматизацию доступной даже для среднего сегмента. Однако эксперты отмечают, что за дешевизной токенов скрываются растущие затраты на квалифицированный промпт-инжиниринг и контроль качества ответов.

Основные факторы, обеспечившие текущий прогресс, включают в себя:

  • Оптимизацию архитектуры моделей (переход к более легковесным и эффективным структурам);
  • Улучшение алгоритмов инференса и квантование весов;
  • Масштабирование специализированной инфраструктуры и долгосрочные контракты с облачными провайдерами.

Несмотря на оптимизм Тейлора, отрасль сталкивается с определенным скепсисом относительно долгосрочной устойчивости такой ценовой политики. Существует мнение, что агрессивное снижение цен — это метод захвата доли рынка перед неизбежным выходом на плато производительности, когда физические ограничения кремниевых чипов и дефицит чистой энергии замедлят темпы оптимизации.