LLM

Последние новости о больших языковых моделях (LLM): GPT, Claude, Gemini, LLaMA и другие. Обзоры новых релизов, сравнения моделей, анализ возможностей и ограничений современных LLM. Следите за развитием технологий искусственного интеллекта в области обработки естественного языка. Практические кейсы применения, туториалы и экспертные мнения.

Экс-инженер Google привлек $8 млн на AI-агентов для групповых чатов

Стартап Continua привлек $8 млн на внедрение AI-агентов в групповые чаты. Основанный экс-инженером Google, сервис автоматизирует планирование встреч и напоминания, но сталкивается с проблемой «социального интеллекта» ИИ.

Ограничения рейтинга Elo для сравнения языковых моделей и пути их преодоления

Исследователи выявили фундаментальные ограничения рейтинговой системы Elo при оценке языковых моделей и предложили комбинированный подход для более точного сравнения.

GPT-5 превзошел GPT-4o в пяти тестовых заданиях

Сравнительное тестирование GPT-5 и GPT-4o в пяти областях показало превосходство новой модели. Детали тестов и экспертная оценка.

OpenAI представляет GPT-5

OpenAI смягчает тон GPT-5 после жалоб на излишнюю формальность

OpenAI срочно смягчает тон GPT-5 после волны критики. Пользователи жаловались на излишнюю холодность новой модели по сравнению с «тёплым» GPT-4o. В ответ компания добавляет режимы общения и корректирует личность ИИ.

Сэм Альтман признал провал запуска GPT-5

CEO OpenAI признал ошибки в запуске GPT-5, вызвавшие бунт пользователей. Экстренное возвращение GPT-4o не скрыло проблем с безопасностью и недооценкой психологической привязанности к ИИ.

Anthropic научил Claude завершать вредоносные диалоги для защиты модели

Anthropic внедрил в Claude Opus функцию принудительного завершения диалогов при вредоносных запросах, мотивируя это защитой «благополучия» ИИ-модели. Нововведение ограничено экстремальными случаями вроде запросов на незаконный контент.