Ведущий геоастроном оспаривает заявление NASA о находке биомаркеров на Марсе, утверждая, что минералы можно объяснить небиологическими процессами. Научный спор продолжает традицию здорового скептицизма в астробиологии.
DeepMind опубликовала третью версию фреймворка безопасности для передовых ИИ-моделей, добавив защиту от вредоносного манипулирования и уточнив процессы оценки рисков.
Meta представляет Gaia2 — новый агентный бенчмарк с открытым фреймворком ARE для тестирования ИИ-агентов в условиях, максимально приближенных к реальному миру.
ServiceNow анонсировала SyGra — low-code фреймворк для генерации и преобразования данных для обучения языковых моделей. Решение упрощает создание сложных датасетов для SFT, DPO и RAG-пайплайнов.
Scale запустила SEAL Showdown — первый рейтинг языковых моделей на основе оценок реальных пользователей из 100+ стран с детальной сегментацией по демографии.
AlphaSense запустила Workflow Agents — автоматизированные рабочие процессы для бизнес-исследований, сокращающие время анализа с дней до минут.