Новый бенчмарк SOOHAK может выявлять склонность ИИ к уверенным галлюцинациям
Новый математический бенчмарк SOOHAK выявил неспособность ведущих ИИ-моделей распознавать некорректные условия задач и их низкую эффективность в высшей математике.
Новый математический бенчмарк SOOHAK выявил неспособность ведущих ИИ-моделей распознавать некорректные условия задач и их низкую эффективность в высшей математике.