GPU Hardware

compute capability

Версионный идентификатор архитектуры GPU NVIDIA, определяющий поддерживаемые функции CUDA.

Что такое compute capability

Compute capability — числовой идентификатор вида X.Y (например, 9.0), присваиваемый каждой архитектуре GPU NVIDIA. Определяет набор функций CUDA, поддерживаемых GPU: типы данных, максимальные размеры блоков, доступные инструкции и аппаратные возможности.

Знать compute capability важно при компиляции CUDA-кода и CUDA-расширений Python: нужно указать правильный таргет, иначе код либо не компилируется, либо не использует возможности GPU.

Таблица соответствия

Архитектура	GPU	Compute Capability
Volta	V100	7.0
Turing	T4, RTX 20xx	7.5
Ampere	A100, RTX 30xx	8.0/8.6
Ada Lovelace	RTX 40xx, L40S	8.9
Hopper	H100, H200	9.0

Практическое использование

# Узнать compute capability текущего GPU
python3 -c "import torch; print(torch.cuda.get_device_capability())"
# → (9, 0)  # H100

# При компиляции CUDA-расширения
TORCH_CUDA_ARCH_LIST="9.0" pip install flash-attn --no-build-isolation

# Проверить через PyTorch
import torch
props = torch.cuda.get_device_properties(0)
print(f"{props.name}: CC {props.major}.{props.minor}")

Связанные термины

CUDA — платформа, использующая compute capability
Tensor Core — возможности TC зависят от CC
NVIDIA H100 — CC 9.0, поддерживает FP8
NVIDIA A100 — CC 8.0

Готовы запустить GPU-задачу?

Запустить GPU-сервер