бенчмарк BullshitBench

Новый бенчмарк BullshitBench проверяет способность ИИ распознавать абсурдные задачи

Бенчмарк BullshitBench выявил неспособность ведущих ИИ-моделей распознавать абсурдные и логически противоречивые запросы, заставляя их галлюцинировать.

LLM не ошибаются, а бездействуют

ИИ-модели при анализе кода стали реже ошибаться, но чаще бездействовать из-за осторожности

Исследование Sonatype выявило новую проблему ИИ в безопасности: вместо галлюцинаций модели теперь выбирают бездействие, оставляя уязвимости в коде.

LLM не очень креативны

Исследование показало, что LLM не слишком креативны и выдают однообразный контент

Новое исследование подтверждает, что нейросети демонстрируют высокую «индивидуальную» оригинальность, но при масштабировании выдают поразительно однообразный контент. Это ставит под вопрос долгосрочную ценность LLM как инструмента для поиска прорывных решений.

OpenAI закрывает Sora

OpenAI закрывает проект Sora и разрывает партнерство с Disney — ради развития робототехники

OpenAI закрывает видеогенератор Sora и прекращает партнерство с Disney, чтобы сфокусироваться на развитии робототехники и агентских ИИ-систем.

CFO прогнозируют сокращения

В крупных корпорациях в США прогнозируется сокращения административного персонала из-за ИИ

Финансовые директора американских компаний прогнозируют сокращение административных должностей в пользу технических специалистов из-за внедрения ИИ.

китайские открытые модели и США

Экспансия открытых китайских ИИ-моделей может угрожать доминированию США

Китайские открытые модели ИИ захватывают рынок, позволяя Пекину конкурировать с США несмотря на дефицит чипов и экспортные ограничения.