GPU 1
H100 SXM
80 ГБ
Hopper
VS
GPU 2
A100 SXM 80GB
Ampere
80 ГБ
Выводы
Лучше для LLM-инференса
H100 SXM
Лучше для обучения моделей
H100 SXM
Сравнение характеристик
| Характеристика | H100 SXM | A100 SXM 80GB |
|---|---|---|
| VRAM | 80ГБ | 80ГБ |
| VRAM bandwidth | 3 350ГБ/с | 2 000ГБ/с |
| CUDA-ядра | 16 896 | 6 912 |
| FP32 TFLOPS | 67.0 | 19.5 |
| FP16 TFLOPS | 1 979.0 | 312.0 |
| BF16 TFLOPS | 1 979.0 | 312.0 |
| FP8 TFLOPS | 3 958.0 | — |
| INT8 TOPS | 3 958.0 | 624.0 |
| TDP | 700Вт | 400Вт |
| Llama 3.1 8B FP16 tok/s | 2 900 | 1 100 |
| Llama 3.1 70B FP16 tok/s | 370 | 130 |
| Llama 3.1 8B FP8 tok/s | 5 200 | — |
| Llama 3.1 70B FP8 tok/s | 700 | — |
| Архитектура | Hopper | Ampere |
| Form factor | SXM | SXM |
| NVLink | Да | Да |
| MIG | Да (7) | Да (7) |
| ECC память | Да | Да |
Значения tokens/sec приблизительные — зависят от конфигурации сервера и настроек vLLM/TGI.