Оглавление

Как пишет NVIDIA в своем блоге, Национальный научный фонд США (NSF) и Институт искусственного интеллекта Аллена (AI2) объявили о создании открытой платформы для разработки фундаментальных ИИ-моделей. Инициатива получила технологическую поддержку NVIDIA, включая доступ к суперкомпьютерным мощностям и оптимизированным фреймворкам.

Детали коллаборации

Проект сосредоточен на трёх ключевых направлениях:

  • Создание открытых языковых моделей с архитектурой, адаптированной для научных исследований
  • Разработка инструментов для интерпретируемости моделей с акцентом на воспроизводимость результатов
  • Формирование публичных датасетов для тренировки в специализированных доменах (биомедицина, материаловедение)

Техническая инфраструктура

NVIDIA предоставляет доступ к кластерам на базе GPU H100 через облачный сервис DGX Cloud. Для исследователей подготовлены предварительно оптимизированные контейнеры с полным стеком ПО:

  • NeMo Framework для тренировки моделей
  • TensorRT-LLM для инференса
  • Интеграция с платформой MLPerf для бенчмаркинга

Ирония в том, что «открытость» здесь имеет границы: доступ к мощностям требует одобрения комиссии NSF, а лицензии моделей остаются под вопросом. При всей значимости шага, это не полноценный аналог открытых инициатив вроде Mistral или Llama. Главное достижение — снижение порога входа для академических команд, особенно в регионах с ограниченным доступом к суперкомпьютерам. Но сохранится ли научная нейтральность при доминировании одного вендора в инфраструктурном слое? Пока это напоминает «демократизацию ИИ» в строго очерченных рамках.

Перспективы для науки

Первыми бенефициарами станут 45 исследовательских групп, уже получивших гранты NSF. Проект включает создание «песочниц» для экспериментов с:

  • Мультимодальными моделями для обработки научных изображений
  • Генеративными ИИ в химическом дизайне
  • Системами автоматического научного рецензирования

Пилотные модели ожидаются в 2026 году, но реальная проверка случится лишь когда независимые команды воспроизведут результаты на альтернативном железе — например, на кластерах AMD или собранных из consumer-grade GPU.