Наиболее мощным на сегодня решением NVIDIA является ускоритель H100. Их серийный выпуск начался не столь давно, 20 сентября. Однако, как выяснилось, ранее опубликованные спецификации новинки оказались не вполне точными, поэтому компания исправила ошибку на своём сайте.
Теперь производительность SXM-версии H100 в вычислениях FP64 составляет не 30, а 34 Тфлопс, а показатель в режиме FP32 вырос с 60 до 67 Тфлопс. Аналогично подросли и показатели H100 в исполнении PCI Express. Однако это не исправление опечаток: графический чип GH100 с 16 896 ядрами CUDA в обоих случаях будет работать на более высокой тактовой частоте, нежели предполагалось ранее.
Предварительно речь шла о 1775 МГц для SXM-версии, что в любом случае весьма много для чипа с 80 млрд транзисторов, но техпроцесс TSMC N4, похоже, способен на большее — как минимум, на 1982 МГц, считают зарубежный ресурс VideoCardz.com.NVIDIA обновила спецификации ускорителя H100 — он стал быстрее в FP32 и FP64
Интересно отметить, что цифры в графах, посвящённых режимам машинного обучения (FP16/8, bfloat16 и INT8) также скорректированы, но в меньшую сторону. По всей видимости, ранее приведённые красивые круглые числа заменены реальными, соответствующими фактическим возможностям тензорных ядер GH100, работающих на определённой частоте.
Также в новых данных указано, что теплопакет новых ускорителей может быть конфигурируемым, хотя предельные цифры остались прежними: 700 Вт для SXM-версии и 350 Вт для версии с разъёмом PCI Express. Первые поставки H100 в составе новых систем DGX начнутся в первом квартале следующего года.
Источник servernews