GPU 1

H100 SXM

80 ГБ Hopper
VS

GPU 2

A100 SXM 80GB

Ampere 80 ГБ

Выводы

Лучше для LLM-инференса

H100 SXM

Лучше для обучения моделей

H100 SXM

Сравнение характеристик

Характеристика H100 SXM A100 SXM 80GB
VRAM 80ГБ 80ГБ
VRAM bandwidth 3 350ГБ/с 2 000ГБ/с
CUDA-ядра 16 896 6 912
FP32 TFLOPS 67.0 19.5
FP16 TFLOPS 1 979.0 312.0
BF16 TFLOPS 1 979.0 312.0
FP8 TFLOPS 3 958.0
INT8 TOPS 3 958.0 624.0
TDP 700Вт 400Вт
Llama 3.1 8B FP16 tok/s 2 900 1 100
Llama 3.1 70B FP16 tok/s 370 130
Llama 3.1 8B FP8 tok/s 5 200
Llama 3.1 70B FP8 tok/s 700
Архитектура Hopper Ampere
Form factor SXM SXM
NVLink Да Да
MIG Да (7) Да (7)
ECC память Да Да

Значения tokens/sec приблизительные — зависят от конфигурации сервера и настроек vLLM/TGI.

Аренда на CloudCompute

H100 SXM

По запросу

Арендовать H100 SXM

A100 SXM 80GB

По запросу

Уточнить наличие