Новый рейтинг TOP500 теперь включает две системы с экзафлопной производительностью. Суперкомпьютер Frontier, возглавляющий список с весны 2022 года, сохранил свою позицию лидера, увеличив производительность за последние шесть месяцев: с 1,206 Эфлопс на практике до 1,715 Эфлопс в теории. Система Aurora, представленная в ноябрьском рейтинге, стала почти вдвое быстрее в бенчмарках и едва преодолела экзафлопсный барьер, достигнув 1,012 Эфлопс.
Теоретическая пиковая производительность Aurora в FP64 составляет 1,98 Эфлопс, но система ещё не принята официально. Текущий результат был достигнут на 87 % доступных узлов (9234). В общей сложности система состоит из 166 стоек, 10 624 узлов, 21 248 процессоров Intel Xeon Max (Sapphire Rapids с HBM) и 63 744 ускорителей Intel Data Center GPU Max. Энергопотребление системы составляет почти 38,7 МВт, в сравнении с 22,7 МВт у Frontier.
Старший брат Frontier, суперкомпьютер El Capitan с производительностью 2 Эфлопс на базе AMD Instinct MI300, должен начать работать в ближайшее время. Поэтому у компании Intel не так много времени, чтобы также преодолеть этот рубеж. В настоящее время Intel объясняет свои результаты тем, что, например, в бенчмарке HPCG, который точнее отражает производительность машины в реальных задачах по сравнению с HPL, Aurora достигла 5,6 Пфлопс, используя только 39% доступных узлов. Однако у Frontier и Fugaku эти показатели составляют 14 и 16 Пфлопс соответственно, и японская система не может быть превзойдена в HPCG уже четыре года.
Intel объявила, что Aurora (точнее, 89 % узлов) заняла первое место в ИИ-тесте HPL-MxP (HPL-AI) с результатом 10,6 Эфлопс при вычислениях смешанной точности. Обновлённый рейтинг ещё не опубликован, но в прошлом году у Frontier был результат 9,95 Эфлопс. Тем не менее, Intel утверждает, что Aurora теперь является самым быстрым научным ИИ-суперкомпьютером, доступным для открытого сообщества. Вероятно, NVIDIA оспорит это утверждение.
Интересно, что за последние полгода конфигурация Frontier осталась прежней, только немного увеличилось энергопотребление. У системы Microsoft Azure Eagle, которая продолжает занимать третье место в TOP500, неожиданно стало в два раза больше ядер, но это никак не повлияло на производительность. MareNostrum 5 ACC уменьшил количество ядер, но в то же время увеличил производительность.
Важное изменение в ТОП500 — появление швейцарского суперкомпьютера Alps на шестом месте. Он был анонсирован три года назад и состоит из 2688 узлов с видеокартами Quad GH200 от NVIDIA, выдающими 270 петафлопс в формате FP64 и потребляющими всего 5,19 мегаватт. Однако суперкомпьютер также включает кластеры на базе AMD EPYC, MI300A и MI250X, а также NVIDIA A100. Главное здесь — не чистая производительность, а энергоэффективность, что очень важно для Швейцарии.
Основные изменения произошли в рейтинге Green500: первые три места и половина первой десятки в целом заняты тестовыми системами на базе NVIDIA Grace Hopper. Самая энергоэффективная машина — JEDI (JUPITER Exascale Development Instrument), которая служит тестовой платформой для европейского экзафлопсного суперкомпьютера Jupiter. Она обеспечивает производительность 72,733 Гфлопс/Вт, в то время как у тестовой платформы Frontier TDS этот показатель составляет 62,684 Гфлопс/Вт. Однако время покажет, насколько хорошо будут масштабироваться новые платформы NVIDIA. Например, у небольшой системы preAlps и полноценной Alps показатели энергоэффективности равны 64,381 и 51,983 Гфлопс/Вт соответственно.
В общей сложности в TOP500 насчитывается семь новых систем на базе Grace Hopper, хотя их число будет значительно расти. На базе AMD EPYC Genoa создано 16 машин, а на базе Intel Xeon Sapphire Rapids — 38. Существует даже один новый суперкомпьютер с Fujitsu A64FX, всего в списке их девять, — португальский Deucalion. Систем с AMD Instinct MI300A сразу три, причём все они абсолютно идентичны: Tuolumne, RZAdams и «часть» El Capitan. Они занимают в списке позиции 46, 47 и 48 и представляют собой фактически одну стойку с производительностью 19,65 Пфлопс (максимум 32,1 Пфлопс).
Текущий список TOP500 включает 49 новых компьютеров, некоторые из которых даже не имеют названий. По количеству установленных систем снова лидирует Lenovo (32,4 %), затем следуют HPE (22,2 %) и Eviden (9,8 %). Что касается общей производительности, то здесь также лидирует HPE (36,1 %), за ней следуют Eviden (9,6 %) и Lenovo (7,4 %). И по числу компьютеров (33,8 %), и по общей мощности (53,6 %) суперкомпьютеры в списке возглавляют США. К сожалению, Китай продолжает игнорировать TOP500.
По материалам:
servernews