LLM

Последние новости о больших языковых моделях (LLM): GPT, Claude, Gemini, LLaMA и другие. Обзоры новых релизов, сравнения моделей, анализ возможностей и ограничений современных LLM. Следите за развитием технологий искусственного интеллекта в области обработки естественного языка. Практические кейсы применения, туториалы и экспертные мнения.

Anthropic тестирует модель Mythos

Из-за утечки данных выяснилось, что Anthropic уже тестирует новую ИИ-модель Mythos

Компания Anthropic, разработчик моделей Claude, допустила серьезную утечку внутренней информации из-за ошибки в настройке системы управления контентом. В открытом доступе оказались данные о неанонсированной нейросети Mythos, планы мероприятий и внутренние документы сотрудников.

OpenAI закрывает Sora

OpenAI закрывает проект Sora и разрывает партнерство с Disney — ради развития робототехники

OpenAI закрывает видеогенератор Sora и прекращает партнерство с Disney, чтобы сфокусироваться на развитии робототехники и агентских ИИ-систем.

pattern-matching и галлюцинации

Исследование показало, что галлюцинации — фундаментальное свойство LLM

Языковые модели страдают от избыточной уверенности из-за особенностей архитектуры и методов обучения. Разбираемся, как специалистам работать с галлюцинациями ИИ.

Xiaomi выпустила MiMo-V2-Pro

Xiaomi выпустила MiMo-V2-Pro — недорогую ИИ-модель на 1 трлн параметров

Xiaomi представила MiMo-V2-Pro — мощную языковую модель для ИИ-агентов, которая обходит западные аналоги по соотношению цены и производительности.

технология сжатия памяти KVTC

Nvidia представила технологию KVTC с 20-кратным сжатием памяти для открытых LLM

Nvidia представила метод KVTC, позволяющий радикально снизить требования к видеопамяти для работы языковых моделей без изменения их весов.

Rakuten AI 3.0 под открытой лицензией

Японская корпорация Rakuten выпустила новую модель Rakuten AI 3.0 под открытой лицензией

Корпорация Rakuten представила новую языковую модель Rakuten AI 3.0, оптимизированную для японского языка, и опубликовала её в открытом доступе под лицензией Apache 2.0.