LLM

Последние новости о больших языковых моделях (LLM): GPT, Claude, Gemini, LLaMA и другие. Обзоры новых релизов, сравнения моделей, анализ возможностей и ограничений современных LLM. Следите за развитием технологий искусственного интеллекта в области обработки естественного языка. Практические кейсы применения, туториалы и экспертные мнения.

GPT-5.2 демонстрирует прорыв

Новая модель GPT-5.2 демонстрирует прорыв в сложных бизнес-задачах и программировании

OpenAI выпустила GPT-5.2 с фокусом на сложные бизнес-задачи и программирование. Модель показывает значительный прогресс в аналитических задачах, но остается медленной для повседневного использования.

Google представила Budget Tracker

Google представила фреймворк для контроля бюджета ИИ-агентов

Исследователи Google представили фреймворк для контроля бюджета ИИ-агентов, который позволяет сократить расходы на вычисления и инструменты до 31% без потери точности.

Google тестирует ИИ-обзоры

Google тестирует ИИ-обзоры статей для избранных новостных изданий

Google запускает пилотную программу с ведущими мировыми изданиями по тестированию ИИ-генерации кратких обзоров новостей с компенсацией за потенциальное снижение трафика.

OpenAI потеряли код GPT Image 2

Из OpenAI утек код GPT Image 2: модель оказалась слабее Google Nano Banana

Утекший код OpenAI GPT Image 2 показал, что модель Chestnut/Hazelnut отстает от Google Nano Banana Pro в реалистичности и качестве генерации изображений.

LexisNexis выпустила Protégé General

LexisNexis выпустила новое поколение юридической ИИ-платформы Protégé General AI

LexisNexis представила новое поколение Protégé General AI с агентной архитектурой, объединяющей юридические документы, веб-контент и авторитетные источники в защищенной среде для юридических workflow.

Бенчмарк FACTS увидел проблемы LLM

Бенчмарк FACTS показал, что ведущие LLM не набрали даже 70% точности по фактам

Google представил бенчмарк FACTS для оценки фактической точности языковых моделей. Результаты показывают, что даже лучшие модели (Gemini 3 Pro, GPT-5) не преодолевают 70% барьер, особенно в мультимодальных задачах.