ИИ проваливает политические опросы, ошибаясь на 23 процентных пункта
Исследование показало, что имитирующие опросы ИИ ошибаются на 23%. Модели систематически искажают мнения меньшинств, но стартапы продолжают их использовать.
Последние новости о больших языковых моделях (LLM): GPT, Claude, Gemini, LLaMA и другие. Обзоры новых релизов, сравнения моделей, анализ возможностей и ограничений современных LLM. Следите за развитием технологий искусственного интеллекта в области обработки естественного языка. Практические кейсы применения, туториалы и экспертные мнения.
Исследование показало, что имитирующие опросы ИИ ошибаются на 23%. Модели систематически искажают мнения меньшинств, но стартапы продолжают их использовать.
Новый тест Spiral-Bench выявил радикальные различия в безопасности языковых моделей: от осторожного GPT-5 до рискованного Deepseek.
Amazon запустила Q Business — корпоративный ИИ-ассистент для анализа данных и автоматизации бизнес-процессов на платформе AWS.
Cohere выпустила Command A Reasoning — первую языковую модель с функцией логического вывода для корпоративных задач. Модель поддерживает 256k токенов и 23 языка.
Microsoft уточняет своё исследование о влиянии ИИ на профессии: полезность технологии не означает автоматического вытеснения рабочих мест. Анализ показывает ограничения методологии.
Google запускает глобальную экспансию AI Mode с функциями бронирования ресторанов и персонализацией для подписчиков Ultra-тарифа за $250 в месяц.