Hopper
2022
Доступна на CloudCompute
H100 SXM
80 ГБ HBM3 · 1979 FP16 TFLOPS · 700 Вт TDP
80 ГБ
VRAM
1,979
FP16 TFLOPS
3350
ГБ/с bandwidth
2,900
tok/s Llama 8B
Технические характеристики
- Архитектура
- Hopper
- Поколение
- 2022
- Form factor
- SXM
- VRAM
- 80 ГБ HBM3
- VRAM bandwidth
- 3350 ГБ/с
- CUDA-ядра
- 16 896
- Tensor cores
- 4th Gen
- FP32 TFLOPS
- 67
- FP16 TFLOPS
- 1979
- BF16 TFLOPS
- 1979
- FP8 TFLOPS
- 3958
- INT8 TOPS
- 3958
- TDP
- 700 Вт
- NVLink
- Да (v4, 900 ГБ/с)
- Max NVLink GPU
- 8× GPU
- PCIe Gen
- Gen 5
- ECC память
- Да
- MIG
- Да (до 7 инстансов)
AI/ML бенчмарки
Tokens per second — выше лучше. Значения приблизительные, зависят от конфигурации сервера.
Llama 3.1 8B · FP16
2,900 tok/s
Llama 3.1 70B · FP16
370 tok/s
Llama 3.1 8B · FP8
5,200 tok/s
Llama 3.1 70B · FP8
700 tok/s
Типичное применение
Обучение моделей
LLM Инференс
HPC / Науч. вычисления
Multi-GPU конфигурации
1×
80 ГБ суммарно
2×
160 ГБ суммарно
4×
320 ГБ суммарно
8×
640 ГБ суммарно