Anthropic обновила Claude, добавив бесплатную функцию памяти и инструмент переноса данных из других чат-ботов. Компания рассчитывает таким образом привлечь пользователей из экосистем ChatGPT и Gemini.
Inception Labs представила Mercury 2 — диффузионную языковую модель, работающую быстрее классических LLM. Архитектура параллельной генерации может изменить подход к инференсу и обучению ИИ-агентов.
Scientel продемонстрировала масштабирование DeepSeek R1 до триллионного уровня параметров на суперкомпьютере OSC. Решение сочетает параллельные вычисления и NewSQL-архитектуру, делая ставку на локальные ИИ-системы вместо облачных API.
Сделка с Vercept усиливает стратегию Anthropic по развитию «computer use» — способности Claude работать с реальными приложениями. Несмотря на прогресс в тестах, массовое внедрение таких агентских функций пока остаётся вызовом.
Ferret-UI Lite — компактная модель Apple для понимания экранов мобильных и десктопных приложений. Она демонстрирует высокие результаты на бенчмарках при работе локально, без облака. Однако сложные многошаговые сценарии пока остаются ограничением.
Anthropic заявила о масштабной операции по копированию Claude через «дистилляцию» ответов модели. По данным компании, китайские разработчики использовали фейковые аккаунты и прокси для обхода ограничений. Скандал разворачивается на фоне ужесточения экспортного контроля США и обвинений в использовании запрещённых чипов Nvidia.