Cerebras выпустила GLM-4.6 — новый ИИ-генератор кода с производительностью 1000 токенов в секунду
Cerebras представила GLM-4.6 — самую быструю модель для генерации кода со скоростью 1000 токенов/с. Доступна от $10 с интеграцией в популярные IDE.
Cerebras представила GLM-4.6 — самую быструю модель для генерации кода со скоростью 1000 токенов/с. Доступна от $10 с интеграцией в популярные IDE.
Сравнительные тесты показывают пятикратное преимущество архитектуры Cerebras над новейшими GPU NVIDIA Blackwell в инференсе модели GPT-OSS 120B.
Cerebras представила технологию REAP, обещающую десятикратное ускорение обучения больших языковых моделей благодаря инновационной архитектуре и специализированным чипам.
Подробный разбор математики MoE-моделей: от расчета памяти до вычислительной сложности. Почему 8x7B на самом деле означает 13B активных параметров.
Сравнительный анализ показывает шестикратное преимущество Cerebras CS-3 над Groq LPU в inference-вычислениях для больших языковых моделей по производительности и энергоэффективности.
Cerebras запускает программу сертификации для API-провайдеров языковых моделей с требованиями к производительности, безопасности и совместимости.