GPU 1

L40S

48 ГБ Ada Lovelace
VS

GPU 2

RTX 4090

Ada Lovelace 24 ГБ

Выводы

Лучше для LLM-инференса

L40S

Лучше для обучения моделей

L40S

Сравнение характеристик

Характеристика L40S RTX 4090
VRAM 48ГБ 24ГБ
VRAM bandwidth 864ГБ/с 1 008ГБ/с
CUDA-ядра 18 176 16 384
FP32 TFLOPS 91.6 82.6
FP16 TFLOPS 183.0 165.2
BF16 TFLOPS 183.0 165.2
FP8 TFLOPS 366.0
INT8 TOPS 366.0
TDP 350Вт 450Вт
Llama 3.1 8B FP16 tok/s 900 680
Llama 3.1 70B FP16 tok/s 110
Llama 3.1 8B FP8 tok/s 1 200
SDXL img/s 3.2
Архитектура Ada Lovelace Ada Lovelace
Form factor PCIE PCIE
NVLink Нет Нет
MIG Нет Нет
ECC память Да Нет

Значения tokens/sec приблизительные — зависят от конфигурации сервера и настроек vLLM/TGI.

Аренда на CloudCompute

L40S

По запросу

Уточнить наличие

RTX 4090

По запросу

Арендовать RTX 4090