Новый фреймворк памяти позволяет ИИ-агентам учиться на ошибках
Фреймворк ReasoningBank позволяет ИИ-агентам учиться на успехах и ошибках, повышая эффективность решения задач на 8.3% и сокращая операционные затраты вдвое.
Последние новости о больших языковых моделях (LLM): GPT, Claude, Gemini, LLaMA и другие. Обзоры новых релизов, сравнения моделей, анализ возможностей и ограничений современных LLM. Следите за развитием технологий искусственного интеллекта в области обработки естественного языка. Практические кейсы применения, туториалы и экспертные мнения.
Фреймворк ReasoningBank позволяет ИИ-агентам учиться на успехах и ошибках, повышая эффективность решения задач на 8.3% и сокращая операционные затраты вдвое.
OpenAI планирует преобразовать ChatGPT в платформу, похожую на операционную систему, с интеграцией приложений от сторонних разработчиков для 800 млн пользователей.
Google представил Gemini 2.5 Computer Use — ИИ-модель для управления пользовательскими интерфейсами. Агенты могут кликать, вводить текст и выполнять задачи в веб-приложениях.
AI21 Labs выпустила Jamba Reasoning 3B — компактную модель с открытым кодом для локального использования. Архитектура SSM-Transformer обеспечивает эффективность в 2-5 раз выше конкурентов.
IBM и Anthropic объявили о партнерстве по интеграции Claude в инструменты разработки, обещая 45% рост продуктивности при соблюдении стандартов безопасности.
Perplexity готовится запустить GPT-5 Pro для пользователей Max-подписки, усиливая конкуренцию с ChatGPT Pro и предоставляя доступ к самой мощной модели OpenAI.