GPU 1

H100 PCIe

80 ГБ Hopper
VS

GPU 2

H200 SXM

Hopper 141 ГБ

Выводы

Лучше для LLM-инференса

H200 SXM

Лучше для обучения моделей

H200 SXM

Сравнение характеристик

Характеристика H100 PCIe H200 SXM
VRAM 80ГБ 141ГБ
VRAM bandwidth 2 000ГБ/с 4 800ГБ/с
CUDA-ядра 14 592 16 896
FP32 TFLOPS 51.0 67.0
FP16 TFLOPS 1 513.0 1 979.0
BF16 TFLOPS 1 513.0 1 979.0
FP8 TFLOPS 3 026.0 3 958.0
INT8 TOPS 3 026.0 3 958.0
TDP 350Вт 700Вт
Llama 3.1 8B FP16 tok/s 2 100 3 200
Llama 3.1 70B FP16 tok/s 280 420
Llama 3.1 8B FP8 tok/s 5 800
Llama 3.1 70B FP8 tok/s 800
Архитектура Hopper Hopper
Form factor PCIE SXM
NVLink Нет Да
MIG Да (7) Да (7)
ECC память Да Да

Значения tokens/sec приблизительные — зависят от конфигурации сервера и настроек vLLM/TGI.

Аренда на CloudCompute

H100 PCIe

По запросу

Уточнить наличие

H200 SXM

По запросу

Арендовать H200 SXM