ИИ не понимает персидскую вежливость: как чат-боты проваливаются в культурных нюансах
Исследование показывает, что ИИ-чаты проваливаются в понимании персидского культурного кода таароф, демонстрируя лишь 34-42% точности против 82% у носителей языка.
Последние новости о больших языковых моделях (LLM): GPT, Claude, Gemini, LLaMA и другие. Обзоры новых релизов, сравнения моделей, анализ возможностей и ограничений современных LLM. Следите за развитием технологий искусственного интеллекта в области обработки естественного языка. Практические кейсы применения, туториалы и экспертные мнения.
Исследование показывает, что ИИ-чаты проваливаются в понимании персидского культурного кода таароф, демонстрируя лишь 34-42% точности против 82% у носителей языка.
NVIDIA выпустила первый открытый синтетический датасет с 6 млн японских персонажей для обучения ИИ культурным особенностям Японии без использования персональных данных.
xAI выпустила Grok 4 Fast — модель ИИ с производительностью уровня Gemini 2.5 Pro, но стоимостью в 25 раз ниже. Контекстное окно 2 млн токенов и скорость 344 токена/сек.
DeepSeek представила V3.1-Terminus — улучшенную гибридную модель ИИ с фокусом на инструментальных задачах. Модель показывает рост производительности до 38.5 баллов в бенчмарках при сохранении агрессивных цен от $1.68 за миллион токенов.
ChatGPT с заявленным интеллектом уровня PhD демонстрирует системные сбои при ответах на простые вопросы про буквы алфавита, выявляя фундаментальные ограничения архитектуры GPT-5.
OpenAI интегрирует GPT-5 в корейский мессенджер KakaoTalk с октября 2025 года. Партнерство позволит 50 млн пользователей получить доступ к последней языковой модели без отдельного приложения.