AI2 представила открытую модель MolmoAct 7B для пространственного мышления роботов. Модель превзошла решения Google и Nvidia в тестах, но эксперты отмечают, что до реального мира ещё далеко.
Ключевые тренды ICML 2025: усиление роли обучения с подкреплением в бизнес-процессах, методы оценки мультиагентных систем и вызовы калибровки уверенности ИИ.
Tencent представила X-Omni — open-source модель генерации изображений, использующую обучение с подкреплением для синхронизации компонентов. Демонстрирует превосходство в визуализации текста, особенно китайского.
Salesforce снизила затраты на инференс LLM в 8 раз благодаря компонентам SageMaker, решающим проблему неэффективного использования GPU при работе с моделями разного размера и нагрузки.
Google представил CTCL — метод генерации дифференциально приватных синтетических данных без тонкой настройки миллиардных LLM. Лёгкая 140M модель создаёт данные по тематическим паттернам, снижая затраты и риски.
Стэнфордское исследование показало: ИИ навязывает западное видение мира через базовые допущения. GPT-4 и Gemini неспособны к онтологической рефлексии, рискуя сузить человеческое воображение.