GPU 1
RTX 3090
24 ГБ
Ampere
VS
GPU 2
A100 PCIe 80GB
Ampere
80 ГБ
Выводы
Лучше для LLM-инференса
A100 PCIe 80GB
Лучше для обучения моделей
A100 PCIe 80GB
Сравнение характеристик
| Характеристика | RTX 3090 | A100 PCIe 80GB |
|---|---|---|
| VRAM | 24ГБ | 80ГБ |
| VRAM bandwidth | 936ГБ/с | 1 935ГБ/с |
| CUDA-ядра | 10 496 | 6 912 |
| FP32 TFLOPS | 35.6 | 19.5 |
| FP16 TFLOPS | 71.0 | 312.0 |
| BF16 TFLOPS | 71.0 | 312.0 |
| INT8 TOPS | — | 624.0 |
| TDP | 350Вт | 300Вт |
| Llama 3.1 8B FP16 tok/s | 400 | 1 050 |
| Llama 3.1 70B FP16 tok/s | — | 120 |
| SDXL img/s | 1.3 | — |
| Архитектура | Ampere | Ampere |
| Form factor | PCIE | PCIE |
| NVLink | Да | Нет |
| MIG | Нет | Да (7) |
| ECC память | Нет | Да |
Значения tokens/sec приблизительные — зависят от конфигурации сервера и настроек vLLM/TGI.