Google представил бенчмарк FACTS для оценки фактической точности языковых моделей. Результаты показывают, что даже лучшие модели (Gemini 3 Pro, GPT-5) не преодолевают 70% барьер, особенно в мультимодальных задачах.
Первое масштабное исследование использования AI-агентов показало, что 57% активности приходится на когнитивную работу, а не рутинные задачи.
Jais 2 — семейство арабских языковых моделей от G42 и Cerebras, работающих со скоростью 2000 токенов/с и устанавливающих новые стандарты культурного соответствия.
Mistral выпустила Devstral 2 — семейство моделей для программирования с открытыми весами, но с ограничениями для крупного бизнеса. Младшая версия свободна для использования, а флагманская требует лицензии при доходе свыше $20 млн.
Google делает Gemini центральным элементом новой экосистемы XR, представляя умные очки с ИИ-ассистентом и новые функции для шлемов дополненной реальности.
Немецкая платформа недвижимости Scout24 внедряет GPT-5 для создания интеллектуального ассистента HeyImmo, который трансформирует поиск жилья через диалог и адаптивные ответы.