Оглавление

Компания Baseten, занимающаяся инфраструктурой для искусственного интеллекта и недавно оцененная в 2,15 миллиарда долларов, совершает стратегический разворот — запускает полноценную платформу для обучения моделей, которая может изменить подход компаний к снижению зависимости от OpenAI и других закрытых поставщиков ИИ.

Проблема, которую решает Baseten

Как сообщает VentureBeat, Baseten Training — это инфраструктурная платформа, предназначенная для тонкой настройки open-source моделей ИИ без операционных сложностей управления GPU-кластерами, мульти-нодной оркестрацией или планированием облачных мощностей.

«У нас была аудитория клиентов, которые постоянно приходили к нам и говорили: „Ненавижу эту проблему“», — рассказывает технический директор компании Амир Хагигат. «Один из них сказал мне: „Я купил кучу H100 у облачного провайдера. Мне приходится подключаться по SSH в пятницу, запускать задачу тонкой настройки, а в понедельник проверять, сработало ли это. Иногда понимаю, что оно вообще не работало“».

Это классическая история стартапов — сначала создать слишком абстрактное решение, а потом понять, что рынку нужен более низкоуровневый подход. Baseten прошла путь от «магического» интерфейса к реальной инфраструктуре, и это показывает, насколько сложен рынок MLOps — здесь нельзя просто спрятать сложность под ковер.

Провал Blueprints и путь к успеху

Это не первая попытка Baseten войти в рынок обучения моделей. Примерно два с половиной года назад компания запустила продукт под названием Blueprints, который провалился — провал, который Хагигат теперь называет поучительным.

«Мы создали слишком высокий уровень абстракции», — объясняет он. «Мы пытались создать магический опыт, где пользователь просто выбирает базовую модель, данные и гиперпараметры, и волшебным образом получает готовую модель».

Проблема оказалась в том, что пользователи не имели интуиции для правильного выбора базовых моделей, качества данных или гиперпараметров. Когда их модели работали плохо, они винили продукт. Baseten оказалась в роли консультанта, а не инфраструктурной компании.

Технические преимущества новой платформы

Новый продукт Baseten Training работает на «инфраструктурном уровне» — более низком, чем провальный эксперимент Blueprints, но с продуманным инструментарием вокруг надежности, наблюдаемости и интеграции со стеком вывода Baseten.

  • Поддержка мульти-нодного обучения на кластерах NVIDIA H100 или B200 GPU
  • Автоматическое создание контрольных точек для защиты от сбоев узлов
  • Планирование задач менее чем за минуту
  • Интеграция с проприетарной системой Multi-Cloud Management (MCM)

Система MCM позволяет Baseten динамически предоставлять GPU-мощности через нескольких облачных провайдеров и регионов, передавая экономию затрат клиентам и избегая ограничений по мощности и многолетних контрактов, типичных для сделок с гиперискалерами.

«С гиперискалерами вы не можете сказать: „Дайте мне три-четыре узла B200, пока моя задача выполняется, а потом заберите их обратно и не взимайте плату“», — говорит Хагигат. «Они говорят: „Нет, вам нужно подписать трехлетний контракт“. Мы так не делаем».

Рыночный контекст и преимущества

Запуск происходит в критический момент принятия ИИ предприятиями. По мере того как open-source модели от Meta*, Alibaba и других все чаще конкурируют с проприетарными системами по производительности, компании сталкиваются с растущим давлением, чтобы сократить зависимость от дорогих API-вызовов к сервисам вроде GPT-5 от OpenAI или Claude от Anthropic.

Baseten выбрала противоположный подход: клиенты владеют своими весами моделей и могут скачивать их по своему усмотрению. Ставка делается на то, что превосходная производительность вывода удержит их на платформе в любом случае.

Интересно, что Baseten честно признает — основной доход все равно в inference, а не в training. Но без качественного обучения не будет качественного вывода. Это как с автомобилями: можно зарабатывать на продаже бензина, но без хороших дорог и заправок машины никуда не поедут.

Результаты ранних пользователей

Два ранних клиента иллюстрируют рынок, на который нацелена Baseten: AI-нативные компании, создающие специализированные вертикальные решения, требующие пользовательских моделей.

Oxen AI, платформа, ориентированная на управление наборами данных и тонкую настройку моделей, демонстрирует модель партнерства, которую представляет Baseten. Генеральный директор Грег Шенингер говорит: «Каждый раз, когда я видел, как платформа пытается делать и железо, и программное обеспечение, она обычно проваливается в одном из них. Поэтому партнерство с Baseten для обработки инфраструктуры было очевидным выбором».

Oxen построила свой клиентский опыт полностью поверх инфраструктуры Baseten, используя Baseten CLI для программной оркестрации задач обучения. Система автоматически предоставляет и отзывает GPU, полностью скрывая интерфейс Baseten за собственным интерфейсом Oxen.

Ранние пользователи сообщают о 84% экономии затрат и 50% улучшении задержек с пользовательскими моделями.

* Meta (признана экстремистской и запрещена в РФ)