LiteCoder-Terminal-Preview — семейство компактных моделей для работы в терминале, обучаемых менее чем на 1000 примеров. Они показывают конкурентные результаты, бросая вызов парадигме больших данных в машинном обучении.
Scale представила бенчмарк Audio MultiChallenge, который тестирует голосовые ИИ на реалистичных диалогах с исправлениями и паузами. Лидером стал Gemini 3 Pro, а GPT-4o значительно отстал.
Google представила Gemini 3 Flash — оптимизированную языковую модель, которая сочетает производительность флагмана с низкой задержкой и стоимостью, нацеленную на разработчиков и массовое внедрение.
OpenAI анонсировала FrontierScience — новый комплексный бенчмарк для оценки способностей ИИ к научным рассуждениям экспертного уровня в физике, химии и биологии.
Консорциум европейских университетов и компаний выпустил полностью открытую языковую модель EuroLLM-22B, обученную на суперкомпьютере и поддерживающую все языки ЕС.
Эксперты Stanford HAI прогнозируют, что 2026 год станет переломным для индустрии ИИ. На смену всеобщему энтузиазму придет прагматичная оценка реальной пользы, ROI и интерпретируемости моделей, особенно в науке, медицине и юриспруденции.