Оглавление
The Decoder сообщает, что компания Илона Маска представила облегченную версию своей флагманской модели. Grok 4 Fast демонстрирует сопоставимую с оригиналом производительность при сокращении вычислительных затрат на 40%, что делает ее одним из самых экономичных предложений на рынке языковых моделей.
Технические характеристики и производительность
Новая модель показывает впечатляющие результаты в бенчмарках: 85.7% в GPQA Diamond и 92.0% в AIME 2025, что ставит ее в один ряд с Grok 4 и даже GPT-5. Ключевое отличие — сокращение использования «токенов мышления» в среднем на 40% для достижения аналогичных результатов.
Особенно заметна разница на сложных задачах, где другие модели требуют больше промежуточных шагов и вычислений. Ранее для простых ответов и сложных рассуждений использовались отдельные модели, но Grok 4 Fast объединяет оба подхода в единую архитектуру, управляемую через системный промпт.
Экономия в 98% на стоимость задачи — это не просто маркетинговая уловка, а реальный технологический прорыв. Такая эффективность может изменить правила игры для массового внедрения ИИ, особенно в регионах с ограниченными вычислительными ресурсами. Вопрос только в том, насколько эти показатели соответствуют реальным рабочим нагрузкам.
Интеграция внешних инструментов и доступность
Модель обучена самостоятельному использованию внешних инструментов, включая веб-браузинг и выполнение кода. В тестах BrowseComp (44.9%) и X Bench Deepsearch (74%) она превосходит Grok 4, а в LMArena-Search обходит даже o3-websearch от OpenAI.
Grok 4 Fast доступна через:
- grok.com
- Мобильные приложения для iOS и Android
- xAI API
- OpenRouter и Vercel (бесплатно на текущий момент)
Модель предлагается в двух версиях: для сложных рассуждений и для быстрых ответов, обе поддерживают контекстное окно в 2 миллиона токенов. Стоимость использования варьируется от $0.05 до $1.00 за миллион токенов в зависимости от типа.
Оставить комментарий