GPU 1

RTX 3090 Ti

24 ГБ Ampere
VS

GPU 2

A100 PCIe 40GB

Ampere 40 ГБ

Выводы

Лучше для обучения моделей

A100 PCIe 40GB

Сравнение характеристик

Характеристика RTX 3090 Ti A100 PCIe 40GB
VRAM 24ГБ 40ГБ
VRAM bandwidth 1 008ГБ/с 1 555ГБ/с
CUDA-ядра 10 752 6 912
FP32 TFLOPS 40.0 19.5
FP16 TFLOPS 80.0 312.0
BF16 TFLOPS 80.0 312.0
INT8 TOPS 624.0
TDP 450Вт 250Вт
Llama 3.1 8B FP16 tok/s 900
Архитектура Ampere Ampere
Form factor PCIE PCIE
NVLink Да Нет
MIG Нет Да (7)
ECC память Нет Да

Значения tokens/sec приблизительные — зависят от конфигурации сервера и настроек vLLM/TGI.