Scale представила бенчмарк Audio MultiChallenge, который тестирует голосовые ИИ на реалистичных диалогах с исправлениями и паузами. Лидером стал Gemini 3 Pro, а GPT-4o значительно отстал.
Google представила Gemini 3 Flash — оптимизированную языковую модель, которая сочетает производительность флагмана с низкой задержкой и стоимостью, нацеленную на разработчиков и массовое внедрение.
Новое исследование Phare V2 показывает, что прогресс в возможностях языковых моделей не привел к аналогичному улучшению их безопасности. Рассуждающие модели не стали устойчивее к взлому, галлюцинациям и предвзятости.
Модель Qwen-Image-i2L генерирует веса адаптера LoRA из изображения за один проход, заменяя часы обучения. Пока она лучше извлекает стиль, чем конкретное содержание, открывая путь к мгновенной персонализации диффузионных моделей.
Эксперт Together.ai оспаривает тезис о «железном потолке» для AGI, утверждая, что низкая утилизация современных чипов и потенциал ко-дизайна железа и софта оставляют огромный простор для роста.
Nscale раскрывает детали работы своей платформы Fleet Operations, которая автоматизирует развертывание, мониторинг и обслуживание тысяч GPU-серверов для индустрии ИИ.