GPU 1
A100 SXM 80GB
80 ГБ
Ampere
VS
GPU 2
A100 PCIe 40GB
Ampere
40 ГБ
Выводы
Лучше для LLM-инференса
A100 SXM 80GB
Сравнение характеристик
| Характеристика | A100 SXM 80GB | A100 PCIe 40GB |
|---|---|---|
| VRAM | 80ГБ | 40ГБ |
| VRAM bandwidth | 2 000ГБ/с | 1 555ГБ/с |
| CUDA-ядра | 6 912 | 6 912 |
| FP32 TFLOPS | 19.5 | 19.5 |
| FP16 TFLOPS | 312.0 | 312.0 |
| BF16 TFLOPS | 312.0 | 312.0 |
| INT8 TOPS | 624.0 | 624.0 |
| TDP | 400Вт | 250Вт |
| Llama 3.1 8B FP16 tok/s | 1 100 | 900 |
| Llama 3.1 70B FP16 tok/s | 130 | — |
| Архитектура | Ampere | Ampere |
| Form factor | SXM | PCIE |
| NVLink | Да | Нет |
| MIG | Да (7) | Да (7) |
| ECC память | Да | Да |
Значения tokens/sec приблизительные — зависят от конфигурации сервера и настроек vLLM/TGI.