Высшая техническая школа Цюриха (ETH Zurich) провела официальную церемонию запуска суперкомпьютера Alps в Швейцарском национальном суперкомпьютерном центре (CSCS) в Лугано. Этот суперкомпьютер, созданный компанией HPE, уже занимает шестое место в последнем рейтинге TOP500 и обладает устойчивой FP64-производительностью 270 петафлопс (теоретический максимум составляет 354 петафлопс). Остальные компоненты системы планируется подключить к ноябрю, после чего её максимальная производительность возрастёт примерно до 500 петафлопс.
В июньском рейтинге TOP500 был представлен кластер из 2688 узлов HPE Cray EX254n с видеокартами NVIDIA Quadro GV100. Точнее говоря, это старая версия ускорителя с H100 (96 ГБ HBM3), 72-ядерным процессором Arm Grace и 128 ГБ LPDDR5x — всего 10 752 ядра Grace Hopper. Этот кластер потребляет 5,2 мегаватта и занимает 14-е место в рейтинге Green500. Узлы оснащены системами жидкостного охлаждения.
Этот кластер является основным, но не единственным компонентом суперкомпьютера. В 2020 году компания HPE развернула ещё 1024 двухпроцессорных узла с 64-ядерными процессорами AMD EPYC 7742 (Rome) и 256/512 ГБ оперативной памяти. Его производительность составляет 4,7 петафлопс. Кроме того, в состав Alps входят 144 узла с одним 64-ядерным процессором AMD EPYC, 128 ГБ оперативной памяти и четырьмя видеокартами NVIDIA A100 (80 или 96 ГБ HBM2e).
В итоге система будет включать 24 узла с одним 64-ядерным процессором AMD EPYC, 128 гигабайтами оперативной памяти и четырьмя ускорителями AMD Instinct MI250X (128 гигабайт HBM2e) и 128 узлов с четырьмя гибридными ускорителями AMD Instinct MI300A. Большинство узлов будет подключено через интерконнект HPE Slingshot-11 со скоростью 200 гигабит на узел или ускоритель. Точная конфигурация системы будет объявлена в ноябре.
Хранилище Lustre для новой системы было обновлено в прошлом году. Основным хранилищем данных является Cray ClusterStor E1000 с подключением Slingshot-11. Были добавлены 100 петабайт полезной жёсткой дисковой памяти (8480 × 16 терабайт) с пропускной способностью 1 терабайт в секунду (300 тысяч операций ввода-вывода в секунду при записи, 1,5 миллиона операций ввода-вывода в секунду при чтении) и 5 петабайт твердотельной памяти, а также резервные хранилища. За долгосрочное хранение отвечают две ленточных библиотеки объёмом 130 петабайт каждая.
Особенность этой системы заключается в её географическом распределении (узлы расположены в четырёх разных местах) и облачной модели использования. Метеорологическая служба MeteoSwiss получила доступ к выделенному виртуальному кластеру, что позволило им перейти на использование метеомоделей с более высоким разрешением, которые лучше учитывают сложный рельеф Швейцарии. Кроме того, некоторые узлы Alps размещены на территории Федеральной политехнической школы Лозанны (EPFL) для дополнительной безопасности.
Alps заменит суперкомпьютер Piz Daint (Cray XC50/40, 21,2 Пфлопс), жизненный цикл которого завершился в конце июля 2024 года. В CSCS останутся машины Arolla + Tsa (для нужд MeteoSwiss) и Blue Brain 5 (решает задачи реконструкции и симуляции мозга). Alps будет использоваться не только для традиционных задач высокопроизводительных вычислений (HPC), но и для разработки ИИ-решений.
По материалам:
servernews