Hopper 2022 Доступна на CloudCompute

H100 SXM

80 ГБ HBM3 · 1979 FP16 TFLOPS · 700 Вт TDP

80 ГБ

VRAM

1,979

FP16 TFLOPS

3350

ГБ/с bandwidth

2,900

tok/s Llama 8B

Технические характеристики

Архитектура
Hopper
Поколение
2022
Form factor
SXM
VRAM
80 ГБ HBM3
VRAM bandwidth
3350 ГБ/с
CUDA-ядра
16 896
Tensor cores
4th Gen
FP32 TFLOPS
67
FP16 TFLOPS
1979
BF16 TFLOPS
1979
FP8 TFLOPS
3958
INT8 TOPS
3958
TDP
700 Вт
NVLink
Да (v4, 900 ГБ/с)
Max NVLink GPU
8× GPU
PCIe Gen
Gen 5
ECC память
Да
MIG
Да (до 7 инстансов)

AI/ML бенчмарки

Tokens per second — выше лучше. Значения приблизительные, зависят от конфигурации сервера.

Llama 3.1 8B · FP16 2,900 tok/s
Llama 3.1 70B · FP16 370 tok/s
Llama 3.1 8B · FP8 5,200 tok/s
Llama 3.1 70B · FP8 700 tok/s

Типичное применение

Обучение моделей LLM Инференс HPC / Науч. вычисления

Multi-GPU конфигурации

80 ГБ суммарно

160 ГБ суммарно

320 ГБ суммарно

640 ГБ суммарно

Цены и конфигурации ← Все GPU