Корпорация Intel представила обновление своего открытого проекта LLM-Scaler, нацеленного на упрощение развертывания больших языковых моделей на потребительских видеокартах серии Arc. Свежий тестовый релиз llm-scaler-vllm 0.14.0-b8.1 расширяет список совместимых нейросетей семейства Qwen, что подчеркивает стремление компании закрепиться в сегменте локальных вычислений ИИ.

Как сообщает профильное издание Phoronix, текущая итерация инструментария базируется на Docker и использует возможности библиотеки vLLM. Технологический фундамент обновления опирается на наработки прошлого года, в частности на оптимизации драйверов в рамках проекта Battlematrix, призванные повысить эффективность работы графических чипов Intel в задачах инференса.

Ключевым нововведением стала поддержка актуальных моделей Qwen3.5. В список вошли тяжеловесные решения: 27B, 35B-A3B и флагманская 122B-A10B. Для работы с ними предусмотрена поддержка квантованных форматов FP8 и INT4, что критически важно для размещения параметров моделей в ограниченном объеме видеопамяти дискретных адаптеров.

Помимо крупных моделей, Intel добавила поддержку Qwen3-ASR-1.7B — компактной нейросети, специализирующейся на автоматическом распознавании речи. Это расширяет функциональность стека LLM-Scaler за пределы простой генерации текста, предлагая разработчикам более универсальный инструмент для создания мультимодальных приложений на базе архитектуры Intel Xe.

Intel методично латает дыры в софтверной экосистеме, пытаясь догнать лидеров рынка, однако привязка к Docker-контейнерам и специфическим веткам vLLM все еще выдает догоняющий характер разработки. Поддержка Qwen3.5 — это правильный шаг в сторону актуального Open Source, но без радикального упрощения порога входа для конечного пользователя Arc рискует остаться выбором лишь энтузиастов-экспериментаторов, а не массового рынка ИИ-разработки.

Технически реализация выполнена в виде готовых образов, что минимизирует зависимости от конкретной операционной системы, фокусируясь на Linux-стеке. Исходный код и инструкции по развертыванию новой версии уже доступны в официальном репозитории Intel на GitHub.