Scientel продемонстрировала масштабирование DeepSeek R1 до триллионного уровня параметров на суперкомпьютере OSC. Решение сочетает параллельные вычисления и NewSQL-архитектуру, делая ставку на локальные ИИ-системы вместо облачных API.
Сделка с Vercept усиливает стратегию Anthropic по развитию «computer use» — способности Claude работать с реальными приложениями. Несмотря на прогресс в тестах, массовое внедрение таких агентских функций пока остаётся вызовом.
Ferret-UI Lite — компактная модель Apple для понимания экранов мобильных и десктопных приложений. Она демонстрирует высокие результаты на бенчмарках при работе локально, без облака. Однако сложные многошаговые сценарии пока остаются ограничением.
Anthropic заявила о масштабной операции по копированию Claude через «дистилляцию» ответов модели. По данным компании, китайские разработчики использовали фейковые аккаунты и прокси для обхода ограничений. Скандал разворачивается на фоне ужесточения экспортного контроля США и обвинений в использовании запрещённых чипов Nvidia.
Google показал, что длина ответа снижает точность, а «глубокие» токены её повышают. Think@n отбрасывает слабые варианты на раннем этапе и почти вдвое уменьшает расходы при росте качества.
Синтез речи переживает революцию: сложные архитектуры TTS уступают место простой связке языковой модели и нейросетевого кодека. Новый подход обеспечивает высокое качество, масштабируемость и мультимодальность.