Google ускоряет Gemma 4 в три раза с помощью технологии многотокенового предсказания
Google представила технологию многотокенового предсказания для моделей Gemma 4, которая позволяет ускорить генерацию текста до трех раз на смартфонах и ПК.
Последние новости о больших языковых моделях (LLM): GPT, Claude, Gemini, LLaMA и другие. Обзоры новых релизов, сравнения моделей, анализ возможностей и ограничений современных LLM. Следите за развитием технологий искусственного интеллекта в области обработки естественного языка. Практические кейсы применения, туториалы и экспертные мнения.
Google представила технологию многотокенового предсказания для моделей Gemma 4, которая позволяет ускорить генерацию текста до трех раз на смартфонах и ПК.
OpenAI обновила стандартную модель ChatGPT до GPT-5.5 Instant, значительно снизив уровень фактических ошибок и улучшив персонализацию ответов.
Открытая модель NVIDIA Nemotron 3 Super со 120 млрд параметров возглавила бенчмарк EnterpriseOps-Gym, продемонстрировав мощь программного стека компании.
OpenAI ввела запрет на упоминание гоблинов в ChatGPT после того, как нейросеть начала неуместно использовать фэнтезийный сленг в общении с пользователями.
Исследование ARC-AGI-3 показало, что даже передовые модели вроде GPT-5.5 совершают критические ошибки в логике, не дотягивая до 1% успеха.
Компания Tencent представила компактную нейросеть Hy-MT1.5-1.8B, которая обеспечивает качественный перевод на 33 языках полностью в офлайн-режиме.