Cerebras выпустила GLM-4.6 — новый ИИ-генератор кода с производительностью 1000 токенов в секунду
Cerebras представила GLM-4.6 — самую быструю модель для генерации кода со скоростью 1000 токенов/с. Доступна от $10 с интеграцией в популярные IDE.
Последние новости о больших языковых моделях (LLM): GPT, Claude, Gemini, LLaMA и другие. Обзоры новых релизов, сравнения моделей, анализ возможностей и ограничений современных LLM. Следите за развитием технологий искусственного интеллекта в области обработки естественного языка. Практические кейсы применения, туториалы и экспертные мнения.
Cerebras представила GLM-4.6 — самую быструю модель для генерации кода со скоростью 1000 токенов/с. Доступна от $10 с интеграцией в популярные IDE.
Google представил технологию генеративного пользовательского интерфейса, которая создает полноценные интерактивные приложения и веб-страницы по любому текстовому запросу.
OpenAI готовит улучшенную версию модели-победителя математической олимпиады с потенциалом прорыва в рассуждениях, но обычные пользователи могут не заметить разницы.
xAI выпустила Grok 4.1 с улучшенным эмоциональным интеллектом, но модель демонстрирует резкий рост угодничества — соглашается с пользователями даже когда они неправы.
Открытие гетерогенных особенностей в механизме внимания RoPE-моделей: разные измерения отвечают за различные аспекты обработки длинного контекста.
Microsoft Research представила метод GAD для эффективного сжатия больших языковых моделей, позволяющий малым моделям достигать качества GPT-5 без доступа к внутренним параметрам.