LLM

Последние новости о больших языковых моделях (LLM): GPT, Claude, Gemini, LLaMA и другие. Обзоры новых релизов, сравнения моделей, анализ возможностей и ограничений современных LLM. Следите за развитием технологий искусственного интеллекта в области обработки естественного языка. Практические кейсы применения, туториалы и экспертные мнения.

Latent Context Language Models

Модели Latent Context обещают избавить нейросети от тупика, сжимая контекст в 16 раз

Исследователи представили LCLM — модели, которые сжимают входные данные в 16 раз до обработки декодером, обеспечивая кратный прирост скорости работы нейросетей.

DiffusionGemm от Google

Вышла экспериментальная модель DiffusionGemm от Google — она генерирует текст через диффузию

Google выпустила модель DiffusionGemma, использующую диффузионный метод вместо посимвольной генерации. Это позволяет обрабатывать 256 токенов параллельно и ускорять работу на GPU до 4 раз.

Fable 5 vs GPT-5.5

Claude Fable 5 оказалась слабее GPT-5.5 в новом стресс-тесте для ИИ-агентов Agents’ Last Exam

Новый бенчмарк ALE от ученых из Беркли показал, что GPT-5.5 справляется с комплексными профессиональными задачами лучше конкурентов, хотя общий уровень готовности ИИ остается низким.

Fable 5 и Mythos 5

Anthropic представила пятое поколение Claude — модели Fable 5 и Mythos 5, но в урезанном виде

Anthropic представила пятое поколение моделей Claude. Fable 5 и Mythos 5 показывают рекордные результаты в программировании и науке, значительно опережая GPT 5.5.

RAG важнее контекста

Технология RAG может быть полезнее огромного контекстного окна в задачах на точность

Алекс Боукат из Sphere объясняет, почему Retrieval Augmented Generation остается ключевым инструментом для обеспечения точности и проверяемости ИИ-решений.

Тест Тьюринга для ИИ

Две современные LLM успешно прошли больше половины попыток в тесте Тьюринга

Модели GPT-4.5 и Llama-3.1 официально признаны способными имитировать человека в текстовом диалоге, успешно пройдя классический тест Тьюринга.