GPU 1
H100 PCIe
80 ГБ
Hopper
VS
GPU 2
H200 SXM
Hopper
141 ГБ
Выводы
Лучше для LLM-инференса
H200 SXM
Лучше для обучения моделей
H200 SXM
Сравнение характеристик
| Характеристика | H100 PCIe | H200 SXM |
|---|---|---|
| VRAM | 80ГБ | 141ГБ |
| VRAM bandwidth | 2 000ГБ/с | 4 800ГБ/с |
| CUDA-ядра | 14 592 | 16 896 |
| FP32 TFLOPS | 51.0 | 67.0 |
| FP16 TFLOPS | 1 513.0 | 1 979.0 |
| BF16 TFLOPS | 1 513.0 | 1 979.0 |
| FP8 TFLOPS | 3 026.0 | 3 958.0 |
| INT8 TOPS | 3 026.0 | 3 958.0 |
| TDP | 350Вт | 700Вт |
| Llama 3.1 8B FP16 tok/s | 2 100 | 3 200 |
| Llama 3.1 70B FP16 tok/s | 280 | 420 |
| Llama 3.1 8B FP8 tok/s | — | 5 800 |
| Llama 3.1 70B FP8 tok/s | — | 800 |
| Архитектура | Hopper | Hopper |
| Form factor | PCIE | SXM |
| NVLink | Нет | Да |
| MIG | Да (7) | Да (7) |
| ECC память | Да | Да |
Значения tokens/sec приблизительные — зависят от конфигурации сервера и настроек vLLM/TGI.