Writer выпустила три компактные языковые модели Palmyra-mini размером 1.5-1.7B параметров с специализацией на логических рассуждениях и математике.
Google Research разработала гибридный метод, сочетающий каскады и спекулятивное декодирование для ускорения работы языковых моделей без потери качества генерации.
OpenAI объявляет о создании гибридной структуры с инвестициями свыше 100 млрд долларов, сочетающей некоммерческий контроль с коммерческой деятельностью.
Together AI и Hugging Face представили интеграцию для дообучения любых совместимых моделей из каталога Hub. Разработчики теперь могут тонко настраивать модели без сложной инфраструктуры.
Google Cloud анонсировала рецепт дезагрегированного инференса LLM с NVIDIA Dynamo на AI Hypercomputer, позволяющий значительно ускорить обработку запросов за счет разделения вычислительных фаз.
Together AI обновила платформу для тонкой настройки ИИ-моделей: поддержка 100B+ параметров, удвоение длины контекста и прямая интеграция с Hugging Face Hub.