NVIDIA обновила спецификации ускорителя H100 — он стал быстрее в FP32 и FP64

Наиболее мощным на сегодня решением NVIDIA является ускоритель H100. Их серийный выпуск начался не столь давно, 20 сентября. Однако, как выяснилось, ранее опубликованные спецификации новинки оказались не вполне точными, поэтому компания исправила ошибку на своём сайте.

Теперь производительность SXM-версии H100 в вычислениях FP64 составляет не 30, а 34 Тфлопс, а показатель в режиме FP32 вырос с 60 до 67 Тфлопс. Аналогично подросли и показатели H100 в исполнении PCI Express. Однако это не исправление опечаток: графический чип GH100 с 16 896 ядрами CUDA в обоих случаях будет работать на более высокой тактовой частоте, нежели предполагалось ранее.

Предварительно речь шла о 1775 МГц для SXM-версии, что в любом случае весьма много для чипа с 80 млрд транзисторов, но техпроцесс TSMC N4, похоже, способен на большее — как минимум, на 1982 МГц, считают зарубежный ресурс VideoCardz.com.NVIDIA обновила спецификации ускорителя H100 — он стал быстрее в FP32 и FP64

Старые (слева) и новые характеристики H100. По нажатию картинка откроется в полном размере. Источник: VideoCardz.com

Интересно отметить, что цифры в графах, посвящённых режимам машинного обучения (FP16/8, bfloat16 и INT8) также скорректированы, но в меньшую сторону. По всей видимости, ранее приведённые красивые круглые числа заменены реальными, соответствующими фактическим возможностям тензорных ядер GH100, работающих на определённой частоте.

Также в новых данных указано, что теплопакет новых ускорителей может быть конфигурируемым, хотя предельные цифры остались прежними: 700 Вт для SXM-версии и 350 Вт для версии с разъёмом PCI Express. Первые поставки H100 в составе новых систем DGX начнутся в первом квартале следующего года.

Источник servernews

Вам может понравиться

Пн	Вт	Ср	Чт	Пт	Сб	Вс
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Добавить комментарий Отменить ответ

Вам может понравиться

Гибридный ускоритель NVIDIA GH200 теперь доступен в составе рабочей станции

Представлен Beelink SER6 Pro Plus: мини-ПК с Ryzen 7000 и графикой Radeon

Анонс Minisforum DeskMini DMAF5: мощный мини-компьютер на процессоре AMD Ryzen 5 3550H

В школах могут появиться «Горынычи» на базе процессоров «Эльбрус»