Scale представила бенчмарк Audio MultiChallenge, который тестирует голосовые ИИ на реалистичных диалогах с исправлениями и паузами. Лидером стал Gemini 3 Pro, а GPT-4o значительно отстал.
Google представила Gemini 3 Flash — оптимизированную языковую модель, которая сочетает производительность флагмана с низкой задержкой и стоимостью, нацеленную на разработчиков и массовое внедрение.
OpenAI анонсировала FrontierScience — новый комплексный бенчмарк для оценки способностей ИИ к научным рассуждениям экспертного уровня в физике, химии и биологии.
Консорциум европейских университетов и компаний выпустил полностью открытую языковую модель EuroLLM-22B, обученную на суперкомпьютере и поддерживающую все языки ЕС.
Эксперты Stanford HAI прогнозируют, что 2026 год станет переломным для индустрии ИИ. На смену всеобщему энтузиазму придет прагматичная оценка реальной пользы, ROI и интерпретируемости моделей, особенно в науке, медицине и юриспруденции.
Cerebras представила Implicit Chain Transformer — архитектуру, решающую проблему отсутствия памяти у языковых моделей. Новая модель передает «вектор намерения» между токенами, что позволяет эффективно поддерживать состояние в задачах вроде сложения по модулю и обхода графа.