GPU 1

RTX 4080

16 ГБ Ada Lovelace
VS

GPU 2

L40S

Ada Lovelace 48 ГБ

Выводы

Лучше для обучения моделей

L40S

Сравнение характеристик

Характеристика RTX 4080 L40S
VRAM 16ГБ 48ГБ
VRAM bandwidth 717ГБ/с 864ГБ/с
CUDA-ядра 9 728 18 176
FP32 TFLOPS 48.7 91.6
FP16 TFLOPS 97.5 183.0
BF16 TFLOPS 97.5 183.0
FP8 TFLOPS 366.0
INT8 TOPS 366.0
TDP 320Вт 350Вт
Llama 3.1 8B FP16 tok/s 900
Llama 3.1 70B FP16 tok/s 110
SDXL img/s 1.9
Архитектура Ada Lovelace Ada Lovelace
Form factor PCIE PCIE
NVLink Нет Нет
MIG Нет Нет
ECC память Нет Да

Значения tokens/sec приблизительные — зависят от конфигурации сервера и настроек vLLM/TGI.