Together AI представила самообучающуюся систему для ускорения языковых моделей
Together AI представила ATLAS — первую самообучающуюся систему спекулятивного декодирования, которая автоматически улучшает производительность LLM во время работы.
Together AI — облачная платформа ускорения ИИ, предоставляющая инфраструктуру и инструменты для тренировки, дообучения и запуска мощных генеративных моделей. Together AI поддерживает более 200 моделей для обработки текста, аудио, изображений, кода и видео, предлагая гибкие OpenAI-совместимые API и возможности кастомизации с полной собственностью моделей.
Платформа выделяется передовыми технологиями ускорения инференса, включая кастомные FP8 ядра, оптимизации для распределенного обучения и масштабируемые GPU-кластеры на базе актуальных чипов NVIDIA (GB200, H200, H100). Together AI обеспечивает низкую цену, высокую скорость и при этом сохраняет точность моделей, что важно для бизнеса и исследователей.
Особенности:
Ссылки:
Together AI представила ATLAS — первую самообучающуюся систему спекулятивного декодирования, которая автоматически улучшает производительность LLM во время работы.
Together AI представил масштабное обновление Batch Inference API с увеличением лимитов обработки в 3000 раз и снижением стоимости на 50% для пакетных операций.
Together AI запустила Instant Clusters — самообслуживаемые GPU-кластеры с поддержкой NVIDIA Hopper и Blackwell для быстрого развертывания ML-инфраструктуры.
Together AI сообщает о разработке системы AI-агентов для автоматизации сложных инженерных рабочих процессов.