NVIDIA представила чудовищный двухчиповый ускоритель H100 NVL со 188 ГБ памяти для обучения языковых моделей

Компания NVIDIA представила ускоритель H100 NVL, который, судя по всему, создан специально для обучения языковых моделей. Как сказано на сайте NVIDIA, cерверы, оснащенные графическими процессорами H100 NVL, повышают производительность модели GPT-175B до 12 раз по сравнению с системами DGX A100, сохраняя при этом низкую задержку в средах центров обработки данных с ограниченным энергопотреблением.

Фактически H100 NVL представляет собой пару H100 на одной плате. Речь идёт о двух GPU, объединённых интерфейсом NVLink, благодаря чему NVIDIA говорит о 68 TFLOPS при вычислениях с двойной точностью (FP64), 143 TFLOPS (Tensor Core FP64), 7916 TOPS (IN8), 188 ГБ памяти с пропускной способностью 7,8 ТБ/с. Всё это позволяет обрабатывать до 175 млрд параметров ChatGPT в режиме реального времени.

Также NVIDIA анонсировала запуск платформ логического вывода для больших языковых моделей и генеративных рабочих нагрузок ИИ. Речь сразу о четырёх платформах логического вывода, оптимизированных для разнообразного набора быстро развивающихся приложений генеративного ИИ.

Каждая платформа сочетает в себе полный стек ПО для логических выводов, новейшие графические процессоры компании, причём как игровые Ada Lovelace, так и специализированные Hopper, а также Grace Hopper Superchip.

Источник ixbt

Вам может понравиться

Пн	Вт	Ср	Чт	Пт	Сб	Вс
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28

>>>

HPE анонсировала точки доступа Wi-Fi 7 семейства Aruba Networking 730 Series для корпоративного сектора

Sitronics Group создала решение для построения сетей Private LTE

Nokia и Vodafone успешно испытали оптическую сеть 100G PON

1 млн Гбит/сек: в Японии испытали новейший интернет

Google запустит тестирование своей «голографической» видеосвязи в крупных компаниях

Netgear представляет мощную, но компактную Mesh-систему Wi-Fi 6E своей линейке Nighthawk

Специалист рассказал, какие на самом деле изменения предполагает закон «О связи»

Китайский стартап начал разворачивать спутниковый 5G-интернет — он должен быть в 5 раз быстрее Starlink

Дроны системы видеонаблюдения подключили к интернету через Starlink

В России запустили квантовую сеть, открытую для присоединения

NVIDIA представила чудовищный двухчиповый ускоритель H100 NVL со 188 ГБ памяти для обучения языковых моделей

>>>

Добавить комментарий Отменить ответ

Вам может понравиться