Модели Anthropic показали самые низкие показатели галлюцинаций в новом бенчмарке
Новый бенчмарк AA-Omniscience оценивает способность языковых моделей отличать факты от вымысла. Модели Anthropic показали самые низкие показатели галлюцинаций.
4 апреля 2026
Новый бенчмарк AA-Omniscience оценивает способность языковых моделей отличать факты от вымысла. Модели Anthropic показали самые низкие показатели галлюцинаций.
Исследование показало, что более 56% ссылок, генерируемых ChatGPT для научных работ, либо полностью выдуманы, либо содержат серьезные ошибки, что ставит под угрозу достоверность исследований.
Стартапы создают компактные ИИ-модели с меньшим числом параметров, которые превосходят гигантов в специализированных задачах при значительно меньших затратах.
ElevenLabs расширяет свою платформу, добавляя инструменты для создания изображений и видео с ИИ. Новая функция объединяет ведущие модели визуального контента с голосовыми технологиями компании.
Норвежский дата-центр Nscale в Гломфьорде демонстрирует новый подход к экологичной ИИ-инфраструктуре с PUE 1.1 и утилизацией 85% тепла для аквакультуры.
Lambda, Cologix и Supermicro запустили в Колумбусе первый в Среднем Западе США кластер на NVIDIA HGX B200, демонстрируя тенденцию к географической диверсификации ИИ-инфраструктуры.