Amazon Web Services (AWS) представила новый процессор Graviton4 и ускоритель Trainium2. Они предназначены для использования в облачных вычислениях и искусственном интеллекте. Компания уже выпустила 2 миллиона процессоров Graviton, и они используются более чем 50 000 клиентов AWS по всему миру.
«Graviton4 представляет собой четвёртое поколение процессоров, которое мы выпустили всего за пять лет, и это самый мощный и энергоэффективный чип, который мы когда-либо создавали для широкого спектра рабочих нагрузок», — отметил Дэвид Браун (David Brown), вице-президент по вычислениям и сетям AWS.
Новый процессор Graviton4 имеет на 30% большую производительность, на 50% больше ядер, и на 75% больше пропускную способность памяти, по сравнению с предыдущим поколением Graviton3.
Graviton4 будет оснащен до 96 ядрами Neoverse V2 Demeter, 12 каналами DDR5-5600 и поддержкой шифрования трафика для всех аппаратных интерфейсов. Он будет изготовлен по 4-нм техпроцессу компании TSMC и, возможно, будет первым CPU компании, предназначенным для работы в двухсокетных платформах.
Graviton4 изначально будет доступен в виде инстансов R8g, которые оптимизированы для приложений, интенсивно использующих память. Эти инстансы поддерживают более крупные конфигурации и имеют в три раза больше виртуальных процессоров (vCPU) и в три раза больше оперативной памяти по сравнению с предыдущими инстансами, которые поддерживали до 64 vCPU и 512 ГБ ОЗУ.
Trainium 2 предназначен для обучения больших языковых моделей и базовых моделей. Он вчетверо быстрее, чем Trainium 1, имеет в 3 раза больше памяти и в 2 раза более высокую эффективность. Инстансы EC2 Trn2 будут иметь 16 таких ускорителей, которые могут быть масштабированы до 100 000 единиц в составе EC2 UltraCluster. Это даст общую производительность 65 экзафлопс, или 650 петафлопс на один ускоритель. Amazon утверждает, что это позволит обучать модели с 300 миллиардами параметров за недели, вместо месяцев.
В будущем на платформе Graviton4 будет работать SAP HANA Cloud. Портирование и оптимизация этой платформы уже ведутся. Oracle перенесла свою базу данных на Arm и перевела все облачные сервисы на процессоры Ampere. Microsoft разрабатывает собственный Arm-процессор Cobalt 100 с 128 ядрами и ИИ-ускоритель Maia 100. Все это в будущем может составить конкуренцию AMD и Intel, но пока что NVIDIA продолжает сотрудничество с ними — самый мощный ИИ-суперкомпьютер ожидается на базе новых серверов GH200 в инфраструктуре Amazon Web Services (AWS).
Источник servernews