Cua-bench — новый фреймворк для генерации разнообразных данных интерфейса и траекторий обучения, решающий проблему хрупкости ИИ-агентов для управления компьютером.
Google Cloud признан лидером в отчете Forrester Wave по инфраструктурным решениям для искусственного интеллекта за 2025 год, получив высшие оценки в стратегии и рыночном присутствии.
AWS анонсировала интеграцию управляемого MLflow на Amazon SageMaker с платформой данных Snowflake. Решение позволяет централизованно отслеживать ML-эксперименты, проводимые в Snowpark, улучшая воспроизводимость и управление моделями.
Google Cloud анонсировала общую доступность сервиса Cluster Director для автоматизации жизненного цикла ИИ- и HPC-кластеров на базе Slurm. Сервис охватывает проектирование, развертывание и мониторинг, стремясь избавить команды от рутины и повысить надежность инфраструктуры.
Scale представила бенчмарк Audio MultiChallenge, который тестирует голосовые ИИ на реалистичных диалогах с исправлениями и паузами. Лидером стал Gemini 3 Pro, а GPT-4o значительно отстал.
Google представила Gemini 3 Flash — оптимизированную языковую модель, которая сочетает производительность флагмана с низкой задержкой и стоимостью, нацеленную на разработчиков и массовое внедрение.