80 ГБ памяти, 700 Вт и 60 TFLOPS. Представлен ускоритель Nvidia H100 на основе GPU поколения Hopper

Обсудить на форуме - Помощь проекту

Итак, как и ожидалось, компания Nvidia представила сегодня архитектуру Hopper и решения на её основе. На момент написания этой новости Nvidia не показала никаких двухчиповых GPU, но и презентация ещё не завершилась.  

Итак, на данный момент единственным решением поколения Hopper является GPU GH100, состоящий из 80 млрд транзисторов. На его основе создан ускоритель Nvidia H100. Параметры самого GPU нам пока не раскрыли, а вот характеристики ускорителя известны. 

Как можно видеть, в зависимости от форм-фактора эти характеристики будут несколько отличаться. У старшей версии имеется 15 872 ядра CUDA. Судя по ранним данным, сам GPU GH100 в полной конфигурации содержит 18 432 ядра. Как можно видеть, архитектура Hopper похожа на игровую архитектуру Ampere удвоенным количеством ALU на блок SM.  

Памяти у обеих версий по 80 ГБ, причём это HBM3 с пропускной способностью 2 либо 3 ТБ/с. TDP старшей версии составляет невероятные 700 Вт, тогда как у модификации с PCIe 5.0 показатель вдвое меньше.

Производительность версии SXM5 достигает 30 TFLOPS (FP64), 60 TFLOPS (FP32), а у версии PCIe 5.0 показатели соответственно равны 24 и 48 TFLOPS. Также стоит отметить интерфейс NVLink, который в том же порядке обеспечивает скорость передачи данных в 900 либо 600 ГБ/с.  

Новая архитектура приносит на рынок и тензорные ядра четвёртого поколения, которые в девять раз быстрее предыдущего поколения в ряде задач машинного обучения. Отдельно Nvidia отмечает новый набор инструкций DPX, который поможет разработчикам писать код для ускорения алгоритмов динамического программирования в различных отраслях, ускоряя рабочие процессы для диагностики заболеваний, квантового моделирования, анализа графов и оптимизации маршрутизации.  

Системы на основе решений Hopper будут доступны партнёрам Nvidia в третьем квартале.