Компания Liqid уже долгое время сотрудничает с Dell. Ещё в прошлом году ей удалось разместить 16 ускорителей в своей платформе UltraStack L40S. Однако компания не остановилась на достигнутом и представила новую композитную платформу UltraStack 30, которая позволяет одновременно использовать до 30 ускорителей в одной системе.
Liqid использует комбинацию собственного программного обеспечения Matrix CDI и интерконнекта Liqid Fabric на основе PCI Express для подключения, настройки и управления ресурсами ускорителей. Это позволяет динамически настраивать аппаратную инфраструктуру с учётом конкретных задач и возвращать ресурсы обратно в общий пул по завершении работы.
Ресурсы «упакованы» в отдельные «капсулы», которые подключаются к одному хост-серверу. Это упрощает процесс масштабирования, снижает потери производительности, улучшает энергоэффективность и обеспечивает более плотную упаковку вычислительных ресурсов по сравнению с классическими решениями с отдельными серверами. Гибкость настройки «на лету» исключает простои дорогостоящего оборудования.
В случае UltraStack 30 стандартным решением является сервер Dell PowerEdge R760 с двумя процессорами Xeon Gold 6430 и 1 ТБ оперативной памяти. Однако также доступен вариант на базе Dell R7625 с процессорами AMD EPYC 9354. Дополнительно можно оснастить систему NVMe-накопителем на 30 ТБ, а среди сетевых опций есть пара адаптеров NVIDIA ConnectX-7 или DPU NVIDIA BlueField-3.
48-портовый коммутатор PCI Express 4.0 и фирменные хост-адаптеры Liqid отвечают за взаимодействие с ускорительными модулями. Технология ioDirect обеспечивает прямое подключение ускорителей и хранилища данных без участия центрального процессора. Каждый из трёх модулей расширения содержит 10 ускорителей NVIDIA L40S с 48 ГБ памяти GDDR6 на борту. Теоретическая производительность такой конфигурации составляет 7,3 Пфлопс при вычислениях FP16, 14,6 Пфлопс при вычислениях FP8 и 1,1 Пфлопс при работе с тензорными ядрами в формате TF32.
Платформа UltraStack 30 создана для быстрого развёртывания мощной ИИ-инфраструктуры, требующей тонкой настройки и дополнительного обучения уже обученных крупных моделей. Следует учесть высокое энергопотребление, превышающее 11 кВт.
Компания также предлагает решения SmartStack на базе модульных систем Dell PowerEdge C-Series, позволяющих подключать до 20 ускорителей к каждому из лезвийных модулей MX760c, MX750c и MX740c. Модульные решения Liqid также поддерживают ускорители других производителей, включая экзотические, такие как Groq.
По материалам:
servernews