LLM

Последние новости о больших языковых моделях (LLM): GPT, Claude, Gemini, LLaMA и другие. Обзоры новых релизов, сравнения моделей, анализ возможностей и ограничений современных LLM. Следите за развитием технологий искусственного интеллекта в области обработки естественного языка. Практические кейсы применения, туториалы и экспертные мнения.

Google ускоряет Gemma 4

Google ускоряет Gemma 4 в три раза с помощью технологии многотокенового предсказания

Google представила технологию многотокенового предсказания для моделей Gemma 4, которая позволяет ускорить генерацию текста до трех раз на смартфонах и ПК.

GPT-5.5 Instant стандартная

В ChatGPT обновилась базовая модель: GPT-5.5 Instant обещает меньше галлюцинаций и больше конкретики

OpenAI обновила стандартную модель ChatGPT до GPT-5.5 Instant, значительно снизив уровень фактических ошибок и улучшив персонализацию ответов.

NVIDIA Nemotron 3 Super

NVIDIA Nemotron 3 Super возглавила рейтинг открытых ИИ-моделей, обойдя DeepSeek и GPT-OSS

Открытая модель NVIDIA Nemotron 3 Super со 120 млрд параметров возглавила бенчмарк EnterpriseOps-Gym, продемонстрировав мощь программного стека компании.

гремлины в ChatGPT

OpenAI пришлось донастраивать ChatGPT, потому что он начал бредить гремлинами

OpenAI ввела запрет на упоминание гоблинов в ChatGPT после того, как нейросеть начала неуместно использовать фэнтезийный сленг в общении с пользователями.

ARC-AGI-3 выявил три ошибки

Исследование выявило 3 ошибки в логике, из-за которых ИИ спотыкается даже на простых задачах

Исследование ARC-AGI-3 показало, что даже передовые модели вроде GPT-5.5 совершают критические ошибки в логике, не дотягивая до 1% успеха.

Модель Tencent для смартфона

Tencent выпустила ИИ-модель на 440 мегабайт для офлайн-перевода на смартфонах

Компания Tencent представила компактную нейросеть Hy-MT1.5-1.8B, которая обеспечивает качественный перевод на 33 языках полностью в офлайн-режиме.