Oracle Cloud Infrastructure станет одним из первых облачных провайдеров, внедряющих новейшие графические процессоры AMD серии Instinct MI350X и сетевые карты Pensando Pollara 400GbE — первый в индустрии сетевой адаптер с поддержкой Ultra Ethernet. Об этом AMD объявила на мероприятии Advancing AI, совпавшем с публикацией спецификации 1.0 технологии Ultra Ethernet для гипермасштабных центров обработки данных ИИ и высокопроизводительных вычислений.
Во второй половине текущего года системы с процессорами AMD Instinct MI350X и сетевыми адаптерами Pensando Pollara 400GbE получат широкое распространение в OCI и, вероятно, у других облачных провайдеров. Для Oracle эти сетевые карты особенно важны, поскольку компания планирует масштабное внедрение графических процессоров AMD для ИИ и создание кластера ИИ мощностью в зеттафлопс, включающего 131 072 процессора Instinct MI355X. Это позволит клиентам осуществлять обучение моделей ИИ и делать выводы в огромных масштабах.
Сетевые карты AMD Pensando Pollara 400GbE, как и другое оборудование с поддержкой Ultra Ethernet, ориентированы на масштабные среды с возможностью размещения до миллиона ИИ-процессоров или графических процессоров. Они обещают шестикратное повышение производительности ИИ-нагрузок. По заявлениям AMD, карта Pollara 400GbE демонстрирует на 10% лучшую производительность RDMA по сравнению с Nvidia CX7 и на 20% — с решением Broadcom Thor2. Дополнительные функции UEC 1.0, такие как эффективная балансировка нагрузки, выборочная ретрансляция и управление перегрузкой с учётом маршрута, могут повысить производительность RDMA ещё на 25% относительно традиционного RoCEv2.
Сетевой адаптер Pensando Pollara 400GbE построен на базе собственного специализированного процессора с программируемым аппаратным обеспечением. Устройство поддерживает RDMA, настраиваемые транспортные протоколы и обеспечивает разгрузку коммуникационных библиотек.
Одной из ключевых особенностей адаптера является его способность к интеллектуальному управлению трафиком. Устройство способно распределять потоки данных по различным маршрутам для предотвращения узких мест и динамически перенаправлять трафик с перегруженных сетевых путей. Это обеспечивает стабильную пропускную способность при масштабном развертывании графических процессоров.
Дополнительным преимуществом AMD Pollara 400GbE является наличие технологии аварийного переключения. Она позволяет быстро обнаруживать и обходить неисправные соединения, сохраняя высокоскоростное взаимодействие между графическими процессорами. Такие функции критически важны для обеспечения бесперебойной работы кластера и минимизации задержек в средах с десятками тысяч взаимосвязанных ускорителей.
Oracle займет позицию первого крупного гиперскейлера, который внедрит сетевые карты AMD Pollara 400GbE. Это обусловлено тем, что компания, скорее всего, станет обладателем крупнейшего кластера на базе AMD Instinct MI355X.
В ближайшее время к этому примеру присоединятся и другие компании, планирующие масштабное развертывание AMD Instinct. Их внедрение будет способствовать росту популярности оборудования Ultra Ethernet на рынке.
В настоящее время сетевые карты уже поставляются заинтересованным организациям, что свидетельствует о начале активного внедрения данной технологии в промышленную эксплуатацию.
По материалам:
tomshardware