Компания Cerebras выпустила новую флагманскую модель GLM-4.6 для генерации кода, которая работает с рекордной скоростью 1000 токенов в секунду и приближается по качеству к Claude Sonnet 4.5. Модель уже доступна в облаке Cerebras по подписке от $10 в месяц.
Технические преимущества GLM-4.6
GLM-4.6 позиционируется как одна из лучших открытых моделей для генерации кода. Согласно Berkeley Function Calling Leaderboard, она занимает первое место по работе с инструментами, опережая Opus 4.1, а на LM Arena по веб-разработке показывает результаты на уровне Sonnet 4.5.

Разработчики выделяют четыре ключевых преимущества модели:
- Надежность работы с инструментами — точно выполняет многошаговые цепочки вызовов, корректно передает структурированные аргументы и избегает ошибок циклических вызовов или некорректного JSON
- Эффективность в веб-разработке — генерирует полнофункциональные приложения от фронтенда на React + Tailwind до бэкенда на Node и Flask с чистой структурой файлов
- Токенная эффективность — в тестах CC-Bench от zAI модель использует на 26% меньше токенов, чем Kimi K2-0905, и на 31% меньше, чем DeepSeek V3.1 Terminus
- Точность редактирования кода — по данным телеметрии из IDE Cline, модель достигает 94,5% точности в редактировании существующего кода
Скорость в 1000 токенов в секунду — это не просто красивая цифра, а реальное изменение пользовательского опыта. Когда код генерируется быстрее, чем ты успеваешь его прочитать, это меняет сам процесс разработки. Интересно, сохранит ли Cerebras такое преимущество, когда конкуренты подтянут свою аппаратную базу.
Рекордная производительность
Cerebras поддерживает свою репутацию самого быстрого провайдера для инференса. GLM-4.6 работает со скоростью более 1000 токенов в секунду — втрое быстрее, чем у ведущего провайдера Kimi K2, и почти в 20 раз быстрее, чем Sonnet 4.5. Правки кода, которые раньше занимали две-три минуты, теперь выполняются менее чем за десять секунд.
Цены

Несмотря на революционную производительность, цены Cerebras остаются конкурентными:
- По сравнению с GPT-5 Codex — в 1,8 раза дороже, но в 6 раз быстрее
- По сравнению с Sonnet 4.5 — в 17 раз быстрее и на 25% дешевле
Модель доступна в нескольких тарифных планах:
- Pay-as-you-go — от $10
- Code Pro — $50/месяц: 1 миллион TPM с лимитом 24 млн токенов в день
- Code Max — $200/месяц: 1,5 миллиона TPM с лимитом 120 млн токенов в день
GLM-4.6 интегрирована с популярными IDE, включая VS Code, Cline, OpenCode и RooCode, что делает её практичным выбором для профессиональной разработки.
По сообщению Cerebras, модель не заменяет Sonnet 4.5 для всех задач, но эффективно справляется с 80% задач по программированию.
Оставить комментарий