Американская технологическая компания Scientel объявила о проведении успешного запуска языковой модели, объем которой в совокупности достиг 6,039 триллиона параметров. Испытания проходили на мощностях суперкомпьютерного центра штата Огайо (OSC), где инженерам удалось объединить возможности открытых весов DeepSeek R1 с собственной архитектурой управления данными.
Как сообщает издание The National Law Review, технический стек решения базировался на использовании 36 графических процессоров Nvidia H100. В основе эксперимента лежала модель DeepSeek R1 (671B), которая сама по себе требует значительных ресурсов для инференса. Scientel применила параллельные вычисления, чтобы продемонстрировать возможность развертывания сверхкрупных систем в частных контурах.
Архитектурные особенности и роль Gensonix
Ключевым элементом системы выступила проприетарная база данных Gensonix NewSQL AI DB. Разработчики утверждают, что их СУБД позволяет эффективно работать с реляционными, текстовыми, документными и векторными данными в рамках единого хранилища. Это избавляет от необходимости конвертации в промежуточные форматы вроде XML или JSON, что теоретически снижает накладные расходы на хранение и обработку информации.
Использование чипов Nvidia H100 с архитектурой Hopper обеспечило необходимую пропускную способность памяти (HBM3) для работы с такими объемами. По заявлению генерального директора Scientel Нормана Кутемперора, решение ориентировано на организации, которые стремятся к созданию суверенных ИИ-систем:
«Мы рады предложить решение для LLM с триллионами параметров для серьезных приложений, использующее мощь Gensonix, Nvidia H100 и DeepSeek R1 для структур, нацеленных на хостинг систем ИИ с большими наборами данных», — говорит Норман Кутемперор
Рыночный контекст и энергоэффективность
В условиях растущего дефицита электроэнергии и мощностей систем охлаждения в дата-центрах, Scientel делает ставку на локальные инсталляции. Стратегия компании подразумевает отказ от публичных облачных API в пользу частных инфраструктур. Это позиционируется как способ обеспечения безопасности данных и снижения зависимости от гигантских энергоемких вычислительных хабов.
Запуск 6-триллионной конфигурации на 36 ускорителях выглядит как впечатляющее упражнение в масштабировании, но за рамками пресс-релиза остается вопрос реальной плотности вычислений. Агрегация параметров через параллелизм — это понятный инженерный ход, однако без данных о задержках (latency) и реальном приросте точности такие цифры рискуют остаться «маркетинговой метрикой». Технологический стек Scientel интересен попыткой гибридизации NewSQL и LLM, но успех будет зависеть от того, сможет ли эта конструкция работать быстрее стандартных связок векторных БД и оптимизированных движков инференса в реальном продакшене.
Scientel, базирующаяся в Мичигане, позиционирует себя как поставщика полного цикла, объединяющего кастомное серверное оборудование и специализированное ПО. Их система Elastic Scaling Servers теоретически поддерживает масштабирование до тысяч вычислительных узлов, что должно удовлетворить потребности корпоративного сектора в обработке сверхбольших массивов данных (Big Data) и внедрении инструментов бизнес-аналитики нового поколения.
Оставить комментарий