Scientel запустила 6-триллионную LLM на суперкомпьютере OSC

Scientel продемонстрировала масштабирование DeepSeek R1 до триллионного уровня параметров на суперкомпьютере OSC. Решение сочетает параллельные вычисления и NewSQL-архитектуру, делая ставку на локальные ИИ-системы вместо облачных API.

Оглавление

Архитектурные особенности и роль Gensonix
Рыночный контекст и энергоэффективность

Американская технологическая компания Scientel объявила о проведении успешного запуска языковой модели, объем которой в совокупности достиг 6,039 триллиона параметров. Испытания проходили на мощностях суперкомпьютерного центра штата Огайо (OSC), где инженерам удалось объединить возможности открытых весов DeepSeek R1 с собственной архитектурой управления данными.

Как сообщает издание The National Law Review, технический стек решения базировался на использовании 36 графических процессоров Nvidia H100. В основе эксперимента лежала модель DeepSeek R1 (671B), которая сама по себе требует значительных ресурсов для инференса. Scientel применила параллельные вычисления, чтобы продемонстрировать возможность развертывания сверхкрупных систем в частных контурах.

Архитектурные особенности и роль Gensonix

Ключевым элементом системы выступила проприетарная база данных Gensonix NewSQL AI DB. Разработчики утверждают, что их СУБД позволяет эффективно работать с реляционными, текстовыми, документными и векторными данными в рамках единого хранилища. Это избавляет от необходимости конвертации в промежуточные форматы вроде XML или JSON, что теоретически снижает накладные расходы на хранение и обработку информации.

Использование чипов Nvidia H100 с архитектурой Hopper обеспечило необходимую пропускную способность памяти (HBM3) для работы с такими объемами. По заявлению генерального директора Scientel Нормана Кутемперора, решение ориентировано на организации, которые стремятся к созданию суверенных ИИ-систем:

«Мы рады предложить решение для LLM с триллионами параметров для серьезных приложений, использующее мощь Gensonix, Nvidia H100 и DeepSeek R1 для структур, нацеленных на хостинг систем ИИ с большими наборами данных», — говорит Норман Кутемперор

Рыночный контекст и энергоэффективность

В условиях растущего дефицита электроэнергии и мощностей систем охлаждения в дата-центрах, Scientel делает ставку на локальные инсталляции. Стратегия компании подразумевает отказ от публичных облачных API в пользу частных инфраструктур. Это позиционируется как способ обеспечения безопасности данных и снижения зависимости от гигантских энергоемких вычислительных хабов.

Запуск 6-триллионной конфигурации на 36 ускорителях выглядит как впечатляющее упражнение в масштабировании, но за рамками пресс-релиза остается вопрос реальной плотности вычислений. Агрегация параметров через параллелизм — это понятный инженерный ход, однако без данных о задержках (latency) и реальном приросте точности такие цифры рискуют остаться «маркетинговой метрикой». Технологический стек Scientel интересен попыткой гибридизации NewSQL и LLM, но успех будет зависеть от того, сможет ли эта конструкция работать быстрее стандартных связок векторных БД и оптимизированных движков инференса в реальном продакшене.

Scientel, базирующаяся в Мичигане, позиционирует себя как поставщика полного цикла, объединяющего кастомное серверное оборудование и специализированное ПО. Их система Elastic Scaling Servers теоретически поддерживает масштабирование до тысяч вычислительных узлов, что должно удовлетворить потребности корпоративного сектора в обработке сверхбольших массивов данных (Big Data) и внедрении инструментов бизнес-аналитики нового поколения.