LLM

Последние новости о больших языковых моделях (LLM): GPT, Claude, Gemini, LLaMA и другие. Обзоры новых релизов, сравнения моделей, анализ возможностей и ограничений современных LLM. Следите за развитием технологий искусственного интеллекта в области обработки естественного языка. Практические кейсы применения, туториалы и экспертные мнения.

Cerebras создала Implicit Chain Transformer

Cerebras создала новую архитектуру нейросетей, чтобы решить проблему памяти у LLM

Cerebras представила Implicit Chain Transformer — архитектуру, решающую проблему отсутствия памяти у языковых моделей. Новая модель передает «вектор намерения» между токенами, что позволяет эффективно поддерживать состояние в задачах вроде сложения по модулю и обхода графа.

Motif выпустил свою ИИ-модель

Стартап Motif выпустил свою ИИ-модель и рассказал, как правильно обучать корпоративные модели

Корейский стартап Motif опубликовал отчет с воспроизводимым рецептом обучения LLM, раскрывая четыре практических урока для корпоративных команд: от выравнивания данных до оптимизации памяти.

LLM — это тупик на пути к AGI

Янн Лекун считает, что LLM — это тупик на пути к искусственному общему интеллекту

Главный научный сотрудник Meta Янн Лекун в споре с DeepMind объяснил, почему большие языковые модели — тупиковый путь к AGI.

ИИ в 2026 ждет коррекция ожиданий

Коррекция ожиданий: как 2025 год стал временем отрезвления для индустрии ИИ

2025 год стал переломным для индустрии ИИ: хайп сменился прагматизмом, внедрение в бизнесе тормозится, а технологические прорывы становятся менее заметными.

NVIDIA выпустила Nemotron 3 Nano

NVIDIA выпустила Nemotron 3 Nano — компактную эффективную языковую модель для агентов

NVIDIA анонсировала Nemotron 3 Nano — компактную языковую модель с гибридной архитектурой Mamba-Transformer MoE и контекстом в 1 млн токенов, предназначенную для создания эффективных ИИ-агентов.

Nvidia выпускает Nemotron 3

Nvidia выпускает семейство open-source моделей Nemotron 3

Nvidia укрепляет позиции в open-source AI, купив разработчика системы управления задачами Slurm и выпустив семейство моделей Nemotron 3 для создания эффективных AI-агентов.