Оглавление

Компания IBM анонсировала коммерческий запуск ускорителя Spyre Accelerator, предназначенного для выполнения генеративных и агентных AI-задач на собственных серверных платформах. Новое решение станет доступно с 28 октября для систем IBM z17 и LinuxONE 5, а в начале декабря — для серверов Power11.

Баннер с изображением чипа IBM Telum Spyre
Источник: www.newsroom.ibm.com

Технические характеристики и архитектура

Spyre Accelerator представляет собой системный чип, созданный по 5-нанометровой технологии и содержащий 25,6 миллиарда транзисторов. Каждый чип включает 32 индивидуальных ускорительных ядра и монтируется на 75-ваттную PCIe карту. Такая конструкция позволяет масштабировать систему до 48 карт в IBM Z или LinuxONE и до 16 карт в Power-системах.

  • 32 ускорительных ядра на чип
  • 25,6 млрд транзисторов по 5 нм технологии
  • Масштабирование до 48 карт в одной системе
  • Поддержка низкой задержки при выводе для AI-агентов

Преимущества для корпоративных клиентов

Основное преимущество Spyre — возможность выполнения AI-задач непосредственно на корпоративных системах IBM без необходимости передачи данных в облако. Это обеспечивает повышенную безопасность и соответствие регуляторным требованиям, что особенно критично для финансовых учреждений и государственных организаций.

В системах IBM Z и LinuxONE ускоритель работает совместно с процессором Telum II, обеспечивая обработку транзакций с высокой пропускной способностью. На платформе Power Spyre интегрирован с каталогом AI-сервисов, позволяя развертывать решения одним кликом.

IBM традиционно делает ставку на гибридные решения, и Spyre — логичное продолжение этой стратегии. Пока Nvidia доминирует в облачных вычислениях, IBM занимает нишу локальных AI для консервативных корпоративных клиентов. Интересно, что 5-нанометровый процесс и 32 ядра — это серьезный технологический рывок для компании, которая последние годы скорее отставала в полупроводниковой гонке. Вопрос в том, найдут ли корпорации достаточную мотивацию для миграции на новые системы ради AI-возможностей.

Производительность и практическое применение

Согласно внутренним тестам IBM, Spyre Accelerator способен обрабатывать более 8 миллионов документов в час для интеграции с базами знаний при размере промпта 128 токенов. Это открывает возможности для таких применений, как:

  • Продвинутое обнаружение мошенничества
  • Розничная автоматизация
  • Обработка больших объемов документов
  • Аналитика транзакций в реальном времени

Решение является результатом пятилетней работы исследовательского центра AI Hardware Center, созданного IBM в 2019 году. От прототипа до коммерческого продукта Spyre прошел этапы быстрых итераций и тестирования в сотрудничестве с университетскими партнерами.

По материалам IBM Newsroom