После нескольких небольших тизеров компания NVIDIA наконец-то представила новый графический процессор архитектуры Ampere под названием GA100, а также тензорный ускоритель A100.
Архитектура Ampere станет единой для всех типов ускорителей NVIDIA, при этом её реализация будет несколько отличаться в зависимости от назначения. Пока компания ведёт речь лишь о профессиональном применении, таком как ИИ, ЦОД и облачные вычисления. Для этих целей и предлагается новый GPU A100 с производительностью 20 терафлопс.
Чип A100 станет наследником Volta V100. Он производится по 7 нм нормам на заводах TSMC и содержит 54 миллиарда транзисторов, вдвое больше, чем у предшественника. В операциях обычной точности производительность составит 19,5 Тфлопс, 9,7 Тфлопс при двойной точности вычислений.
Если говорить о ядрах Tensor Core, применяемых в машинном обучении, то их производительность составляет 312 Тфлопс в задачах Tensor точности FP16. Что касается самой платформы ускорителя, то она содержит 40 ГБ памяти HBM2 с пропускной способностью в 1,6 ТБ/с. Количество ядер CUDA равно 6912 штукам. Тепловой пакет процессора A100 составляет 400 Вт, что на 50 Вт выше, чем у V100.
Что касается GA100, то он содержит 8192 ядра CUDA. В качестве видеопамяти используется 6 стеков HBM2 с пропускной способностью 2,4 Гб/с, которые подключены к 5 512-битным контроллерам памяти. всё вместе это обеспечивает ширину шины памяти в 6144 бита. Объём самой видеопамяти составляет 48 ГБ.
К сожалению, в ходе презентации, которую Дженсен Хуан вёл из дома, он ничего не сообщил о том, когда же новая архитектура найдёт себе место в игровых видеокартах GeForce.