GPU Hardware

compute capability

Версионный идентификатор архитектуры GPU NVIDIA, определяющий поддерживаемые функции CUDA.

Что такое compute capability

Compute capability — числовой идентификатор вида X.Y (например, 9.0), присваиваемый каждой архитектуре GPU NVIDIA. Определяет набор функций CUDA, поддерживаемых GPU: типы данных, максимальные размеры блоков, доступные инструкции и аппаратные возможности.

Знать compute capability важно при компиляции CUDA-кода и CUDA-расширений Python: нужно указать правильный таргет, иначе код либо не компилируется, либо не использует возможности GPU.

Таблица соответствия

Архитектура GPU Compute Capability
Volta V100 7.0
Turing T4, RTX 20xx 7.5
Ampere A100, RTX 30xx 8.0/8.6
Ada Lovelace RTX 40xx, L40S 8.9
Hopper H100, H200 9.0

Практическое использование

# Узнать compute capability текущего GPU
python3 -c "import torch; print(torch.cuda.get_device_capability())"
# → (9, 0)  # H100

# При компиляции CUDA-расширения
TORCH_CUDA_ARCH_LIST="9.0" pip install flash-attn --no-build-isolation

# Проверить через PyTorch
import torch
props = torch.cuda.get_device_properties(0)
print(f"{props.name}: CC {props.major}.{props.minor}")

Связанные термины

  • CUDA — платформа, использующая compute capability
  • Tensor Core — возможности TC зависят от CC
  • NVIDIA H100 — CC 9.0, поддерживает FP8
  • NVIDIA A100 — CC 8.0

Готовы запустить GPU-задачу?

Запустить GPU-сервер