Оглавление
Компания IBM анонсировала коммерческий запуск ускорителя Spyre Accelerator, предназначенного для выполнения генеративных и агентных AI-задач на собственных серверных платформах. Новое решение станет доступно с 28 октября для систем IBM z17 и LinuxONE 5, а в начале декабря — для серверов Power11.

Технические характеристики и архитектура
Spyre Accelerator представляет собой системный чип, созданный по 5-нанометровой технологии и содержащий 25,6 миллиарда транзисторов. Каждый чип включает 32 индивидуальных ускорительных ядра и монтируется на 75-ваттную PCIe карту. Такая конструкция позволяет масштабировать систему до 48 карт в IBM Z или LinuxONE и до 16 карт в Power-системах.
- 32 ускорительных ядра на чип
- 25,6 млрд транзисторов по 5 нм технологии
- Масштабирование до 48 карт в одной системе
- Поддержка низкой задержки при выводе для AI-агентов
Преимущества для корпоративных клиентов
Основное преимущество Spyre — возможность выполнения AI-задач непосредственно на корпоративных системах IBM без необходимости передачи данных в облако. Это обеспечивает повышенную безопасность и соответствие регуляторным требованиям, что особенно критично для финансовых учреждений и государственных организаций.
В системах IBM Z и LinuxONE ускоритель работает совместно с процессором Telum II, обеспечивая обработку транзакций с высокой пропускной способностью. На платформе Power Spyre интегрирован с каталогом AI-сервисов, позволяя развертывать решения одним кликом.
IBM традиционно делает ставку на гибридные решения, и Spyre — логичное продолжение этой стратегии. Пока Nvidia доминирует в облачных вычислениях, IBM занимает нишу локальных AI для консервативных корпоративных клиентов. Интересно, что 5-нанометровый процесс и 32 ядра — это серьезный технологический рывок для компании, которая последние годы скорее отставала в полупроводниковой гонке. Вопрос в том, найдут ли корпорации достаточную мотивацию для миграции на новые системы ради AI-возможностей.
Производительность и практическое применение
Согласно внутренним тестам IBM, Spyre Accelerator способен обрабатывать более 8 миллионов документов в час для интеграции с базами знаний при размере промпта 128 токенов. Это открывает возможности для таких применений, как:
- Продвинутое обнаружение мошенничества
- Розничная автоматизация
- Обработка больших объемов документов
- Аналитика транзакций в реальном времени
Решение является результатом пятилетней работы исследовательского центра AI Hardware Center, созданного IBM в 2019 году. От прототипа до коммерческого продукта Spyre прошел этапы быстрых итераций и тестирования в сотрудничестве с университетскими партнерами.
По материалам IBM Newsroom
Оставить комментарий