Как решить проблему нестабильности LLM-оценок в корпоративных приложениях
Scale обнаружила фундаментальную проблему нестабильности LLM-оценок с вариативностью до 15% и предложила решение через когорту из трех моделей-судей.
Scale AI — инфраструктура для обучения AI. Разметка данных, RLHF, оценка моделей. Поставщик данных для OpenAI, Meta и других гигантов.
Scale обнаружила фундаментальную проблему нестабильности LLM-оценок с вариативностью до 15% и предложила решение через когорту из трех моделей-судей.
Scale AI запускает масштабную программу обучения ИИ для американских школьников и учителей с конкретными цифрами: 1000 педагогов и 500 тысяч студентов к 2029 году.
Расследование показывает, как африканские работники становятся разменной монетой в гонке ИИ-разработок, страдая от тактики «трудового хеджирования» вместо обещанной стабильной занятости.
Scale AI обнаружила фундаментальную проблему цепочки инструментов в LLM и предложила революционный подход: заставить модели генерировать планы вместо выполнения задач.
Scale AI представила Rubrics as Rewards — метод обучения ИИ через детализированные чек-листы вместо упрощенных оценок, что даёт до 28% улучшения качества ответов.
Стратегическое партнерство Meta* и Scale AI сталкивается с проблемами: отток ключевых сотрудников, предпочтение конкурентов и вопросы к качеству данных.