Радиоастрономия — почтенная наука, связанная с изучением космоса и имеющая почти вековую историю. Но современные радиотелескопы очень сложны и генерируют огромные объёмы данных, обработать которые может только суперкомпьютер. Суперкомпьютерный центр Pawsey, расположенный в австралийском городе Перт, готовится к такому «наводнению», источником которого должен стать массив телескопов SKA.
Название проекта SKA расшифровывается как Square Kilometre Array — «антенный массив площадью в квадратный километр». Это крупнейший международный проект в области радиоастрономии, предусматривающий создание радиоинтерферометра с невиданной ранее площадью антенного поля. На самом деле с девяностых годов проект был существенно доработан, и теперь собирающая площадь SKA существенно превышает эту цифру.
Комплекс, включающий в себя сотни антенн и сотни тысяч элементов низкочастотного апертурного массива, будет располагаться сразу на двух континентах, в наиболее отдалённых местах Австралии и Южной Африки — для минимизации радиопомех, создаваемых современной человеческой деятельностью.
Сооружение SKA одобрено примерно неделю назад, но проект весьма масштабен. Полного окончания работ следует ожидать к концу текущего десятилетия, но готовиться к наплыву данных, поступающих со столь продвинутого радиотелескопа следует уже сейчас. Об этом объявил суперкомпьютерный центр Pawsey, расположенный в нескольких сотнях километров от будущей австралийской части SKA и обязанный своему рождению в 2014 году именно этому проекту.
Центр Pawsey успешно получил финансирование в объёме $70 млн, которые будут потрачены на замену и обновление сетевой и вычислительной инфраструктуры, а также систем хранения данных. Поставщиком нового оборудования является HPE Cray, будущий суперкомпьютер уже получил имя Setonix, в честь симпатичного австралийского зверька, известного как квокка.
Существующие мощности центра Pawsey оцениваются примерно в 1,8 Пфлопс, но Setonix будет в 30 раз мощнее и разовьет 50 Пфлопс, став быстрейшим суперкомпьютером Австралии. Объем объектных СХД в его составе достигнет 60 Пбайт — и это радует сотрудников Pawsey, ведь даже сейчас, на 20% вычислительных мощностей центра, относящихся к астрономическим задачам, приходится 80% всего объёма данных. В настоящее время эти данные поступают с другого радиотелескопа, MWA.
Стоит отметить, что данные поступают не в «сыром» виде — у MWA есть собственный ЦОД, заключённый в клетку Фарадея для предотвращения влияния на работу антенного комплекса. За обработку поступающего «сырья» отвечает массив на базе ПЛИС и графических ускорителей, причём это одна из крупнейших ПЛИС-систем в мире. И уже сейчас ясно, что более масштабная радиоастрономия требует перемены подхода к хранению и перемещению данных.
Ранее достаточно было простой калибровки, оцифровки и сохранения поступающих сигналов с помощью ленточных библиотек для последующей обработки, поскольку объёмы варьировались в пределах от гигабайт до терабайт. Но сейчас речь идёт уже о петабайтах, и для анализа таких массивов требуется настоящий суперкомпьютер. В рамках проекта ASKAP центр Pawsey совместно с HPE Cray разрабатывает платформу, способную справиться с таким потоком, причём речь идёт, в том числе, и об обработке в реальном времени.