Все ведущие производители серверного оборудования представили свои варианты решений для набирающего популярность сектора ИИ-систем и комплексов машинного обучения, но IBM одна из немногих, кто использует нестандартную архитектуру.
Серверы такого типа могут использовать разные ускорители, но центральные процессоры у них обычно x86. Новая система Power System IBM IC922 не такова — её сердцем являются процессоры POWER9.
В конструкции данного сервера используется системная плата с двумя процессорными разъёмами LGA2601 (POWER9 SO), поддерживающая установку двух 12-ядерных (2,8 ГГц), 16-ядерных (3,35 ГГц) или 20-ядерных 2,9 ГГц) чипов Sforza. Максимальный объём оперативной памяти составляет 2 Тбайт в 32 слотах DDR4-2666.
К плате посредством опциональных бэкплейнов можно подключить до 24 накопителей с интерфейсом SAS 3.0/SATA (поддержка NVMe будет добавлена позже). За питание отвечает пара блоков питания мощностью 2000 Ватт с горячим резервированием. Шасси имеет высоту 2U и может устанавливаться в стандартную 19″ стойку.
Что делает данный сервер хорошо подходящим для исполнения нейронных сетей, так это возможность установки до шести ускорителей NVIDIA T4. Это компактные однослотовые PCIe-платы на базе архитектуры Turing, каждая из них имеет 320 тензорных ядер и 2560 ядер CUDA, а также 16 Гбайт памяти GDDR6 с пропускной способностью 300 Гбайт/с.
Каждый ускоритель T4 может обеспечить до 65 Тфлопс на смешанных вычислениях FP16/FP32 и 130 Топс на вычислениях INT8. Тепловыделение в предельном случае не превышает 420 Ватт (70 Ватт на ускоритель) и платы довольствуются потоком воздуха, создаваемым системой охлаждения самого сервера.
Слотов PCI Express в системе 10, часть из них имеет версию 3.0 и допускает установку полноразмерных двухслотовых карт расширения, но есть и пара слотов версии 4.0.
IBM Power System IC922 работает под управлением операционной системы Red Hat Enterprise Linux 7.6-ALT for IBM Power LE. Поставки нового сервера должны начаться 7 февраля, полный список доступных комплектующих можно найти на сайте IBM. Новая система может работать в паре с другим сервером IBM, Power System AC922 с ускорителями Tesla V100, образуя единую высокопроизводительную ИИ-систему.