Модели Latent Context обещают избавить нейросети от тупика, сжимая контекст в 16 раз
Исследователи представили LCLM — модели, которые сжимают входные данные в 16 раз до обработки декодером, обеспечивая кратный прирост скорости работы нейросетей.
Последние новости о больших языковых моделях (LLM): GPT, Claude, Gemini, LLaMA и другие. Обзоры новых релизов, сравнения моделей, анализ возможностей и ограничений современных LLM. Следите за развитием технологий искусственного интеллекта в области обработки естественного языка. Практические кейсы применения, туториалы и экспертные мнения.
Исследователи представили LCLM — модели, которые сжимают входные данные в 16 раз до обработки декодером, обеспечивая кратный прирост скорости работы нейросетей.
Google выпустила модель DiffusionGemma, использующую диффузионный метод вместо посимвольной генерации. Это позволяет обрабатывать 256 токенов параллельно и ускорять работу на GPU до 4 раз.
Новый бенчмарк ALE от ученых из Беркли показал, что GPT-5.5 справляется с комплексными профессиональными задачами лучше конкурентов, хотя общий уровень готовности ИИ остается низким.
Anthropic представила пятое поколение моделей Claude. Fable 5 и Mythos 5 показывают рекордные результаты в программировании и науке, значительно опережая GPT 5.5.
Алекс Боукат из Sphere объясняет, почему Retrieval Augmented Generation остается ключевым инструментом для обеспечения точности и проверяемости ИИ-решений.
Модели GPT-4.5 и Llama-3.1 официально признаны способными имитировать человека в текстовом диалоге, успешно пройдя классический тест Тьюринга.