После запуска 1-Эфлопс суперкомпьютера Frontier, Соединённые Штаты повысили планку производительности для следующей серии машин — они должны быть примерно в 5–10 раз быстрее Frontier. Как минимум одна такая система запланирована к запуску на 2025–2030 гг., и Министерство энергетики США уже запрашивает информацию от поставщиков, чтобы «помочь национальным лабораториям в планировании, проектировании, вводе в эксплуатацию и приобретении следующего поколения суперкомпьютерных систем».
В опубликованном министерством запросе информации (Request for information, RFI) указано, что ведомство заинтересовано в развёртывании одного или нескольких суперкомпьютеров, которые могут решать научные задачи в 5–10 раз быстрее или же решать более сложные задачи, например, с большим количеством физических расчётов или с расчётами более высокой точности, чем нынешние передовые компьютерные системы.
Также указывается, что новым машинам понадобятся подобающие такой производительности сетевые архитектуры, архитектуры хранения данных и мощный программный стек, рассчитанные на широкий спектр приложений и рабочих нагрузок, включая крупномасштабные моделирования и симуляции, машинный интеллект и анализ данных. Кроме того, они должны быть устойчивыми к аппаратным и программным сбоям, чтобы свести к минимуму необходимость ручных работ.
В запросе указано, что эти системы будут потреблять порядка 20–60 МВт. В примечании уточняется оценка производительности — до 10–20+ Эфлопс (FP64) в период после 2025 года и 100+ Эфлопс (FP64) в период после 2030 года. Эти показатели будут достигнуты «за счёт механизмов аппаратного и программного ускорения». В целом же ожидается «грандиозная конвергенция моделирования и симуляции, анализа данных, глубокого обучения, ИИ, квантовых вычислений и других новых возможностей в интегрированных инфраструктурах».
Также в RFI предлагается пересмотреть подход с созданию систем для обеспечения более коротких циклов обновления путём отказа от монолитных комплексов в пользу модульности для ускорения внедрения инноваций в области аппаратного и программного обеспечения — например, каждые год-два, а не 4–5 лет. Идеальная будущая система будет более гибкой, модульной и расширяемой. Кроме того, следующее поколение суперкомпьютеров должно быть способно интегрироваться в экосистему ACE (Advanced Computing Ecosystem), которая поддерживает автоматизацию рабочих процессов разных типов.
Информация, запрашиваемая Министерством энергетики США у поставщиков, довольно подробна и охватывает не только типы процессоров, памяти, хранилищ и интерконнектов, которые поставщики планируют использовать в период с 2025 по 2030 год, но и то, какие производственные процессы, по их мнению, будут использоваться в чипах, будут ли процессоры представлять собой APU/XPU, какова ожидаемая пропускная способность интерконнекта, каковы потенциальные конфигурации узлов и т. д.
Ответы на этот запрос, которые должны быть предоставлены до конца июля, помогут Министерству энергетики США и национальным лабораториям обновить свои долгосрочные планы по внедрению передовых вычислений. В разделе «задание для разработки» подчёркивается важность моделирования и симуляции на основе данных для национальных приоритетов в области науки, энергетики и безопасности.
При этом некоторые эксперты полагают, что США заметно отстали от Китая в суперкомпьютерной гонке — у КНР ещё в прошлом году появились две машины экзафлопсного класса, а к 2025 году их количество может вырасти до 10. Над системами следующего поколения работы тоже ведутся. Вместе с тем не все специалисты в области HPC считают, что использование текущего подхода к созданию всё более мощных и прожорливых суперкомпьютеров в национальных лабораториях разумно и эффективно.
Источник servernews