xAI выпустила экономичную языковую модель Grok 4 Fast

xAI представила оптимизированную языковую модель Grok 4 Fast с экономией вычислений до 40% и снижением стоимости задач на 98% при сохранении производительности уровня GPT-5.

Оглавление

Технические характеристики и производительность
Интеграция внешних инструментов и доступность

The Decoder сообщает, что компания Илона Маска представила облегченную версию своей флагманской модели. Grok 4 Fast демонстрирует сопоставимую с оригиналом производительность при сокращении вычислительных затрат на 40%, что делает ее одним из самых экономичных предложений на рынке языковых моделей.

Технические характеристики и производительность

Новая модель показывает впечатляющие результаты в бенчмарках: 85.7% в GPQA Diamond и 92.0% в AIME 2025, что ставит ее в один ряд с Grok 4 и даже GPT-5. Ключевое отличие — сокращение использования «токенов мышления» в среднем на 40% для достижения аналогичных результатов.

Особенно заметна разница на сложных задачах, где другие модели требуют больше промежуточных шагов и вычислений. Ранее для простых ответов и сложных рассуждений использовались отдельные модели, но Grok 4 Fast объединяет оба подхода в единую архитектуру, управляемую через системный промпт.

Экономия в 98% на стоимость задачи — это не просто маркетинговая уловка, а реальный технологический прорыв. Такая эффективность может изменить правила игры для массового внедрения ИИ, особенно в регионах с ограниченными вычислительными ресурсами. Вопрос только в том, насколько эти показатели соответствуют реальным рабочим нагрузкам.

Интеграция внешних инструментов и доступность

Модель обучена самостоятельному использованию внешних инструментов, включая веб-браузинг и выполнение кода. В тестах BrowseComp (44.9%) и X Bench Deepsearch (74%) она превосходит Grok 4, а в LMArena-Search обходит даже o3-websearch от OpenAI.

Grok 4 Fast доступна через:

grok.com
Мобильные приложения для iOS и Android
xAI API
OpenRouter и Vercel (бесплатно на текущий момент)

Модель предлагается в двух версиях: для сложных рассуждений и для быстрых ответов, обе поддерживают контекстное окно в 2 миллиона токенов. Стоимость использования варьируется от $0.05 до $1.00 за миллион токенов в зависимости от типа.

Новости

xAI выпустила оптимизированную языковую модель Grok 4 Fast с экономией токенов до 40%

Технические характеристики и производительность

Интеграция внешних инструментов и доступность

Еще интереснее

В Google придумали, обновлять убеждения LLM при получении новой информации

OpenAI представила GPT-5.4: агентная автономность и прямой контроль интерфейсов

Институт Аллена выпустил новую версию гибридной модели Olmo Hybrid 7B

ИИ от Meta* не ограничивается только Llama: что известно про проекты Mango и Avocado

Оставить комментарий