LLM

Последние новости о больших языковых моделях (LLM): GPT, Claude, Gemini, LLaMA и другие. Обзоры новых релизов, сравнения моделей, анализ возможностей и ограничений современных LLM. Следите за развитием технологий искусственного интеллекта в области обработки естественного языка. Практические кейсы применения, туториалы и экспертные мнения.

Claude решил задачу на alignment

Claude обошел человека в задаче на alignment, но провалился в реальных условиях

Автономные агенты Claude Opus 4.6 блестяще справились с исследовательской задачей в лаборатории, но не смогли улучшить работу реальных моделей в продакшене.

Claude Mythos взламывает сети

Claude Mythos от Anthropic может автономно взломать сеть целой компании

Британский институт безопасности ИИ протестировал Claude Mythos Preview в сценариях взлома сетей. Результаты впечатляют, но есть нюансы.

LPM 1.0 генерирует аватар 45 минут

Новая модель LPM 1.0 умеет стабильно генерировать аватар человека в течение 45 минут

Исследователи представили LPM 1.0 — модель ИИ, способную генерировать живое видео из одного фото с поддержкой синхронизации губ и естественной мимики в реальном времени.

OpenAI готовит модель Spud

OpenAI готовит модель Spud и платформу агентов: в сеть утекла служебная записка

Внутренняя записка OpenAI раскрывает планы по запуску модели Spud и платформы Frontier, а также содержит резкую критику методов отчетности Anthropic.

видеогенераторы не world models

Исследователи предлагают не считать ИИ-генераторы видео «мировыми моделями»

Международная группа ученых представила OpenWorldLib и доказала, что популярные видеогенераторы вроде Sora лишены ключевых свойств моделей мира.

Zhipu AI представила GLM-5.1

Zhipu AI представила GLM-5.1 — модель, способную сотни раз переосмысливать свои ошибки

Zhipu AI представила GLM-5.1 — модель, которая умеет переосмысливать свои ошибки в коде через сотни итераций и обходит конкурентов в специфических тестах.