Ampere
2020
A100 SXM 80GB
80 ГБ HBM2e · 312 FP16 TFLOPS · 400 Вт TDP
80 ГБ
VRAM
312
FP16 TFLOPS
2000
ГБ/с bandwidth
1,100
tok/s Llama 8B
Технические характеристики
- Архитектура
- Ampere
- Поколение
- 2020
- Form factor
- SXM
- VRAM
- 80 ГБ HBM2e
- VRAM bandwidth
- 2000 ГБ/с
- CUDA-ядра
- 6 912
- Tensor cores
- 3rd Gen
- FP32 TFLOPS
- 19.5
- FP16 TFLOPS
- 312
- BF16 TFLOPS
- 312
- INT8 TOPS
- 624
- TDP
- 400 Вт
- NVLink
- Да (v3, 600 ГБ/с)
- Max NVLink GPU
- 8× GPU
- PCIe Gen
- Gen 4
- ECC память
- Да
- MIG
- Да (до 7 инстансов)
AI/ML бенчмарки
Tokens per second — выше лучше. Значения приблизительные, зависят от конфигурации сервера.
Llama 3.1 8B · FP16
1,100 tok/s
Llama 3.1 70B · FP16
130 tok/s
Типичное применение
Обучение моделей
LLM Инференс
HPC / Науч. вычисления
Multi-GPU конфигурации
1×
80 ГБ суммарно
2×
160 ГБ суммарно
4×
320 ГБ суммарно
8×
640 ГБ суммарно