GPU 1
RTX 4090
24 ГБ
Ada Lovelace
VS
GPU 2
L40S
Ada Lovelace
48 ГБ
Выводы
Лучше для LLM-инференса
L40S
Лучше для обучения моделей
L40S
Сравнение характеристик
| Характеристика | RTX 4090 | L40S |
|---|---|---|
| VRAM | 24ГБ | 48ГБ |
| VRAM bandwidth | 1 008ГБ/с | 864ГБ/с |
| CUDA-ядра | 16 384 | 18 176 |
| FP32 TFLOPS | 82.6 | 91.6 |
| FP16 TFLOPS | 165.2 | 183.0 |
| BF16 TFLOPS | 165.2 | 183.0 |
| FP8 TFLOPS | — | 366.0 |
| INT8 TOPS | — | 366.0 |
| TDP | 450Вт | 350Вт |
| Llama 3.1 8B FP16 tok/s | 680 | 900 |
| Llama 3.1 70B FP16 tok/s | — | 110 |
| Llama 3.1 8B FP8 tok/s | 1 200 | — |
| SDXL img/s | 3.2 | — |
| Архитектура | Ada Lovelace | Ada Lovelace |
| Form factor | PCIE | PCIE |
| NVLink | Нет | Нет |
| MIG | Нет | Нет |
| ECC память | Нет | Да |
Значения tokens/sec приблизительные — зависят от конфигурации сервера и настроек vLLM/TGI.