Ampere
2021
A100 PCIe 80GB
80 ГБ HBM2e · 312 FP16 TFLOPS · 300 Вт TDP
80 ГБ
VRAM
312
FP16 TFLOPS
1935
ГБ/с bandwidth
1,050
tok/s Llama 8B
Технические характеристики
- Архитектура
- Ampere
- Поколение
- 2021
- Form factor
- PCIe
- VRAM
- 80 ГБ HBM2e
- VRAM bandwidth
- 1935 ГБ/с
- CUDA-ядра
- 6 912
- Tensor cores
- 3rd Gen
- FP32 TFLOPS
- 19.5
- FP16 TFLOPS
- 312
- BF16 TFLOPS
- 312
- INT8 TOPS
- 624
- TDP
- 300 Вт
- NVLink
- Нет
- PCIe Gen
- Gen 4
- ECC память
- Да
- MIG
- Да (до 7 инстансов)
AI/ML бенчмарки
Tokens per second — выше лучше. Значения приблизительные, зависят от конфигурации сервера.
Llama 3.1 8B · FP16
1,050 tok/s
Llama 3.1 70B · FP16
120 tok/s
Типичное применение
Обучение моделей
LLM Инференс
Multi-GPU конфигурации
1×
80 ГБ суммарно
2×
160 ГБ суммарно
4×
320 ГБ суммарно
8×
640 ГБ суммарно