LLM

Последние новости о больших языковых моделях (LLM): GPT, Claude, Gemini, LLaMA и другие. Обзоры новых релизов, сравнения моделей, анализ возможностей и ограничений современных LLM. Следите за развитием технологий искусственного интеллекта в области обработки естественного языка. Практические кейсы применения, туториалы и экспертные мнения.

GPT-5 не оправдал ожиданий

GPT-5 оказался надежнее и быстрее предшественников, но разочаровал тех, кто ждал революцию

GPT-5 демонстрирует технические улучшения в скорости и надежности, но не оправдывает ожиданий революционного прорыва. Модель стала более предсказуемой, но потеряла креативность.

Исследование о глобальном использовании OpenAI

OpenAI раскрыла реальные данные использования ChatGPT: 700 миллионов пользователей и неожиданные паттерны

OpenAI опубликовала первое исследование использования ChatGPT на основе внутренних данных: 700 млн пользователей, рост личного использования и доминирование письменных задач.

Решение проблемы неопределенности в ИИ-моделях

Как решить проблему нестабильности LLM-оценок в корпоративных приложениях

Scale обнаружила фундаментальную проблему нестабильности LLM-оценок с вариативностью до 15% и предложила решение через когорту из трех моделей-судей.

Anthropic - разработчик ИИ Claude AI

Anthropic представила географический анализ использования ИИ в экономике

Anthropic опубликовала географический анализ использования ИИ Claude, выявивший сильную корреляцию между экономическим развитием регионов и уровнем внедрения искусственного интеллекта.

OpenAI - разработчик ChatGPT

Исследование OpenAI показывает массовое внедрение ChatGPT в повседневную жизнь

Крупнейшее исследование OpenAI показывает: ChatGPT используют 700 млн человек еженедельно, гендерный разрыв сократился, а развивающиеся страны adopt технологию в 4 раза быстрее.

Hugging Face представляет новый фреймворк

Hugging Face представляет новый фреймворк для оценки языковых моделей

Hugging Face выпустила открытый фреймворк для систематической оценки и сравнения больших языковых моделей по различным метрикам производительности.