GPU Hardware
compute capability
Версионный идентификатор архитектуры GPU NVIDIA, определяющий поддерживаемые функции CUDA.
Что такое compute capability
Compute capability — числовой идентификатор вида X.Y (например, 9.0), присваиваемый каждой архитектуре GPU NVIDIA. Определяет набор функций CUDA, поддерживаемых GPU: типы данных, максимальные размеры блоков, доступные инструкции и аппаратные возможности.
Знать compute capability важно при компиляции CUDA-кода и CUDA-расширений Python: нужно указать правильный таргет, иначе код либо не компилируется, либо не использует возможности GPU.
Таблица соответствия
| Архитектура | GPU | Compute Capability |
|---|---|---|
| Volta | V100 | 7.0 |
| Turing | T4, RTX 20xx | 7.5 |
| Ampere | A100, RTX 30xx | 8.0/8.6 |
| Ada Lovelace | RTX 40xx, L40S | 8.9 |
| Hopper | H100, H200 | 9.0 |
Практическое использование
# Узнать compute capability текущего GPU
python3 -c "import torch; print(torch.cuda.get_device_capability())"
# → (9, 0) # H100
# При компиляции CUDA-расширения
TORCH_CUDA_ARCH_LIST="9.0" pip install flash-attn --no-build-isolation
# Проверить через PyTorch
import torch
props = torch.cuda.get_device_properties(0)
print(f"{props.name}: CC {props.major}.{props.minor}")
Связанные термины
- CUDA — платформа, использующая compute capability
- Tensor Core — возможности TC зависят от CC
- NVIDIA H100 — CC 9.0, поддерживает FP8
- NVIDIA A100 — CC 8.0
Готовы запустить GPU-задачу?
Запустить GPU-сервер