GPU 1

A100 PCIe 80GB

80 ГБ Ampere
VS

GPU 2

A100 PCIe 40GB

Ampere 40 ГБ

Выводы

Лучше для LLM-инференса

A100 PCIe 80GB

Сравнение характеристик

Характеристика A100 PCIe 80GB A100 PCIe 40GB
VRAM 80ГБ 40ГБ
VRAM bandwidth 1 935ГБ/с 1 555ГБ/с
CUDA-ядра 6 912 6 912
FP32 TFLOPS 19.5 19.5
FP16 TFLOPS 312.0 312.0
BF16 TFLOPS 312.0 312.0
INT8 TOPS 624.0 624.0
TDP 300Вт 250Вт
Llama 3.1 8B FP16 tok/s 1 050 900
Llama 3.1 70B FP16 tok/s 120
Архитектура Ampere Ampere
Form factor PCIE PCIE
NVLink Нет Нет
MIG Да (7) Да (7)
ECC память Да Да

Значения tokens/sec приблизительные — зависят от конфигурации сервера и настроек vLLM/TGI.