Writer выпускает семейство компактных языковых моделей Palmyra-mini для эффективного логического вывода

Writer выпустила три компактные языковые модели Palmyra-mini размером 1.5-1.7B параметров с специализацией на логических рассуждениях и математике.

Google логотип

Google Research представила гибридный метод для ускорения работы языковых моделей

Google Research разработала гибридный метод, сочетающий каскады и спекулятивное декодирование для ускорения работы языковых моделей без потери качества генерации.

OpenAI и ChatGPT

OpenAI создает гибридную структуру с инвестициями свыше 100 миллиардов долларов

OpenAI объявляет о создании гибридной структуры с инвестициями свыше 100 млрд долларов, сочетающей некоммерческий контроль с коммерческой деятельностью.

Дообучение любых моделей с Hugging Face Hub теперь стало проще благодаря каталогу Together AI

Together AI и Hugging Face представили интеграцию для дообучения любых совместимых моделей из каталога Hub. Разработчики теперь могут тонко настраивать модели без сложной инфраструктуры.

Google Cloud представила рецепт ускоренного инференса LLM с NVIDIA Dynamo

Google Cloud анонсировала рецепт дезагрегированного инференса LLM с NVIDIA Dynamo на AI Hypercomputer, позволяющий значительно ускорить обработку запросов за счет разделения вычислительных фаз.

Together AI обновил сервис тонкой настройки больших языковых моделей

Together AI обновила платформу для тонкой настройки ИИ-моделей: поддержка 100B+ параметров, удвоение длины контекста и прямая интеграция с Hugging Face Hub.