GPU 1

RTX 4090

24 ГБ Ada Lovelace
VS

GPU 2

H100 PCIe

Hopper 80 ГБ

Выводы

Лучше для LLM-инференса

H100 PCIe

Лучше для обучения моделей

H100 PCIe

Сравнение характеристик

Характеристика RTX 4090 H100 PCIe
VRAM 24ГБ 80ГБ
VRAM bandwidth 1 008ГБ/с 2 000ГБ/с
CUDA-ядра 16 384 14 592
FP32 TFLOPS 82.6 51.0
FP16 TFLOPS 165.2 1 513.0
BF16 TFLOPS 165.2 1 513.0
FP8 TFLOPS 3 026.0
INT8 TOPS 3 026.0
TDP 450Вт 350Вт
Llama 3.1 8B FP16 tok/s 680 2 100
Llama 3.1 70B FP16 tok/s 280
Llama 3.1 8B FP8 tok/s 1 200
SDXL img/s 3.2
Архитектура Ada Lovelace Hopper
Form factor PCIE PCIE
NVLink Нет Нет
MIG Нет Да (7)
ECC память Нет Да

Значения tokens/sec приблизительные — зависят от конфигурации сервера и настроек vLLM/TGI.

Аренда на CloudCompute

RTX 4090

По запросу

Арендовать RTX 4090

H100 PCIe

По запросу

Уточнить наличие