Облачный сервис AWS объявил о доступности инстансов EC2 P5en, предназначенных для таких ресурсоёмких задач, как глубинное обучение, генеративный искусственный интеллект, обработка данных в режиме реального времени и высокопроизводительные вычисления. В основе этих новых экземпляров лежат аппаратные компоненты компаний Intel и NVIDIA.
Например, используются специализированные процессоры Xeon Sapphire Rapids. У них все ядра могут одновременно работать на тактовой частоте 3,2 ГГц, а максимальная частота отдельных ядер составляет 3,8 ГГц. Кроме того, используются ИИ-ускорители NVIDIA H200 и адаптеры AWS Elastic Fabric Adapter (EFA) версии 3 с пропускной способностью до 3,2 Тбит/с.
Конфигурация EC2 P5en включает 192 виртуальных процессора (vCPU), 2048 гигабайт оперативной памяти, восемь ускорителей H200 и восемь твердотельных накопителей (SSD) ёмкостью 3,84 терабайта каждый. Пропускная способность системы хранения данных (EBS) составляет 100 гигабит в секунду. Отмечено, что экземпляры P5en обеспечивают двукратное увеличение производительности локального хранилища и повышение пропускной способности EBS на 25 % по сравнению с инстансами P5 на базе NVIDIA H100.
В настоящее время инстансы EC2 P5en доступны в американских регионах AWS US East (Огайо) и US West (Орегон), а также в Азиатско-Тихоокеанском регионе в Токио. Доступны различные тарифные планы, включая оплату по мере использования.
Изначально были представлены инстансы EC2 P5e с процессорами AMD EPYC Milan, 2 ТиБ памяти, восемью ускорителями NVIDIA H200 и восемью NVMe SSD на 3,84 Тбайт каждый. У этих экземпляров пропускная способность EBS составляет 80 Гбит/с.
По материалам:
servernews