Дообучение любых моделей с Hugging Face Hub теперь стало проще благодаря каталогу Together AI

Together AI и Hugging Face представили интеграцию для дообучения любых совместимых моделей из каталога Hub. Разработчики теперь могут тонко настраивать модели без сложной инфраструктуры.

Google Cloud представила рецепт ускоренного инференса LLM с NVIDIA Dynamo

Google Cloud анонсировала рецепт дезагрегированного инференса LLM с NVIDIA Dynamo на AI Hypercomputer, позволяющий значительно ускорить обработку запросов за счет разделения вычислительных фаз.

Together AI обновил сервис тонкой настройки больших языковых моделей

Together AI обновила платформу для тонкой настройки ИИ-моделей: поддержка 100B+ параметров, удвоение длины контекста и прямая интеграция с Hugging Face Hub.

Google логотип

Google выводит на рынок готовые решения для масштабирования ML-инференса

Google Cloud анонсировала коммерческую доступность GKE Inference Gateway с новыми функциями оптимизации производительности и стоимости ML-инференса.

Together AI нанимает бывшего вице-президента Meta*, чтобы усилить направление облачной инфраструктуры

Стартап Together AI укрепляет инженерную команду, наняв экс-вице-президента Meta* по инфраструктуре для масштабирования облачных сервисов ИИ.

Google показывает рекламу в ИИ-ответах

Google теперь может внедрять рекламу даже в AI-ответы в поиске

Google начал глобальное внедрение рекламы в AI-генерируемые ответы поиска через инструмент AI Max, что меняет его роль с поискового посредника на контент-провайдера с монетизацией.