Grok 4 Fast от xAI снижает стоимость ИИ на 98%

xAI выпустила Grok 4 Fast — модель ИИ с производительностью уровня Gemini 2.5 Pro, но стоимостью в 25 раз ниже. Контекстное окно 2 млн токенов и скорость 344 токена/сек.

Оглавление

Эффективность как конкурентное преимущество
Архитектурные инновации
Производительность и практическое применение
Коммодитизация передового ИИ

Сообщает BDTechTalks, что компания xAI выпустила модель Grok 4 Fast, которая кардинально меняет экономику использования высококлассного искусственного интеллекта. Новая разработка демонстрирует производительность на уровне Google Gemini 2.5 Pro, но при этом стоит в 25 раз дешевле.

Эффективность как конкурентное преимущество

Ключевое достижение Grok 4 Fast — сочетание низкой стоимости и высокой эффективности обработки токенов. Согласно данным xAI, модель использует в среднем на 40% меньше «токенов мышления» для решения задач по сравнению с предшественником Grok 4. При выполнении сложных рассуждающих задач, генерирующих десятки тысяч токенов, такая эффективность приводит к существенному снижению затрат.

Сравнение эффективности затрат: сокращение использования токенов моделью Grok 4 Fast

Модель также обладает контекстным окном объемом 2 миллиона токенов, что значительно превосходит возможности конкурентов:

Gemini 2.5 — 1 миллион токенов
GPT-5 — 400 тысяч токенов
Claude Opus 4.1 — 128 тысяч токенов

Внешние бенчмарки подтвердили эффективность модели: для прохождения Artificial Analysis Intelligence Index Grok 4 Fast потребовалось всего 61 миллион токенов против 93 миллионов у Gemini 2.5 Pro и 120 миллионов у полной версии Grok 4.

Архитектурные инновации

Хотя xAI не раскрывает детали архитектуры Grok 4, в блоге компании упоминается «единая архитектура, где рассуждения (длинные цепочки мыслей) и не-рассуждения (быстрые ответы) обрабатываются одинаковыми весами модели, управляемыми через системные промпты». Этот подход аналогичен использованному в Anthropic Claude 3.7, где специальные токены активируют механизм рассуждений модели.

Унифицированная архитектура — это умный ход, позволяющий избежать сложностей с маршрутизацией запросов между разными моделями. Однако отсутствие технических деталей заставляет задуматься: действительно ли это прорывная технология или просто удачный маркетинговый ход на фоне растущей конкуренции?

Интересные аспекты обучения включают оптимизированный процесс обучения с подкреплением (RL) и end-to-end обучение с использованием инструментов через RL. Это улучшает способность модели решать, когда использовать внешние инструменты типа веб-поиска или выполнения кода.

Производительность и практическое применение

На тестах рассуждений Grok 4 Fast набрала 60 баллов на Artificial Analysis Intelligence Index, что ставит ее в один ряд с Gemini 2.5 Pro и Claude 4.1 Opus. Особенно впечатляющи результаты в кодинге — модель заняла первое место на LiveCodeBench и обогнала большей версии Grok 4.

Скорость вывода составляет 344 токена в секунду, что примерно в 2.5 раза быстрее API GPT-5 от OpenAI. Одно из ключевых применений — агентский поиск с возможностью обработки данных из веба и X, включая текст, изображения и видео.

Коммодитизация передового ИИ

Grok 4 Fast уже доступна всем пользователям на grok.com и в мобильных приложениях, включая бесплатный тариф. Для разработчиков модель доступна через API xAI как два эндпоинта: grok-4-fast-reasoning и grok-4-fast-non-reasoning.

Ценообразование установлено на уровне $0.20 за 1 миллион входных токенов и $0.80 за 1 миллион выходных токенов. Такая ценовая политика делает передовые возможности ИИ доступными для значительно более широкого круга разработчиков и компаний.

Новости

Новая модель Grok 4 Fast от xAI обещает производительность уровня Gemini 2.5, но на 98% дешевле

Эффективность как конкурентное преимущество

Архитектурные инновации

Производительность и практическое применение

Коммодитизация передового ИИ

Еще интереснее

В Google придумали, обновлять убеждения LLM при получении новой информации

OpenAI представила GPT-5.4: агентная автономность и прямой контроль интерфейсов

Институт Аллена выпустил новую версию гибридной модели Olmo Hybrid 7B

ИИ от Meta* не ограничивается только Llama: что известно про проекты Mango и Avocado

Оставить комментарий