GPU 1

RTX 4090

24 ГБ Ada Lovelace
VS

GPU 2

L40S

Ada Lovelace 48 ГБ

Выводы

Лучше для LLM-инференса

L40S

Лучше для обучения моделей

L40S

Сравнение характеристик

Характеристика RTX 4090 L40S
VRAM 24ГБ 48ГБ
VRAM bandwidth 1 008ГБ/с 864ГБ/с
CUDA-ядра 16 384 18 176
FP32 TFLOPS 82.6 91.6
FP16 TFLOPS 165.2 183.0
BF16 TFLOPS 165.2 183.0
FP8 TFLOPS 366.0
INT8 TOPS 366.0
TDP 450Вт 350Вт
Llama 3.1 8B FP16 tok/s 680 900
Llama 3.1 70B FP16 tok/s 110
Llama 3.1 8B FP8 tok/s 1 200
SDXL img/s 3.2
Архитектура Ada Lovelace Ada Lovelace
Form factor PCIE PCIE
NVLink Нет Нет
MIG Нет Нет
ECC память Нет Да

Значения tokens/sec приблизительные — зависят от конфигурации сервера и настроек vLLM/TGI.

Аренда на CloudCompute

RTX 4090

По запросу

Арендовать RTX 4090

L40S

По запросу

Уточнить наличие