GPU Hardware

PCIe

Стандарт шины для подключения GPU к серверу; ограничивает скорость multi-GPU коммуникации.

Что такое PCIe

PCIe (Peripheral Component Interconnect Express) — стандарт шины для подключения карт расширения (GPU, NVMe SSD) к материнской плате. В серверах это основной интерфейс передачи данных между CPU и GPU.

Для одиночного GPU PCIe обычно не является узким местом: данные на GPU загружаются один раз, а все вычисления происходят в VRAM. Проблемы возникают в multi-GPU конфигурациях без NVLink, где GPU вынуждены обмениваться данными через PCIe-коммутатор.

Поколения и пропускная способность

Поколение	Пропускная способность (×16 lanes)	Двунаправленная
PCIe 3.0	16 ГБ/с	32 ГБ/с
PCIe 4.0	32 ГБ/с	64 ГБ/с
PCIe 5.0	64 ГБ/с	128 ГБ/с

Для сравнения: NVLink 4.0 (H100) — 900 ГБ/с двунаправленно.

PCIe vs NVLink для multi-GPU

При tensor parallelism=4 через PCIe 4.0:

AllReduce для batched 70B-инференса: 40–60% overhead от полезной работы
Эффективное ускорение: 4× GPU дают ~2.5–3× из-за коммуникационного узкого места

При tensor parallelism=4 через NVLink 4.0:

AllReduce overhead: <5%
Эффективное ускорение: ~3.8×

Вывод: для серьёзного multi-GPU инференса/обучения важно выбирать инстансы с NVLink (SXM-форм-фактор).

H100 PCIe vs H100 SXM

H100 поставляется в двух форм-факторах. PCIe-версия дешевле, но без NVLink:

H100 SXM (в DGX/HGX): NVLink 4.0 + HBM3 (3350 ГБ/с)
H100 PCIe: PCIe 5.0 + HBM2e (2000 ГБ/с)

Связанные термины

NVLink — высокоскоростная альтернатива PCIe для multi-GPU
tensor parallelism — страдает от PCIe-узкого места
GPU — устройство, подключаемое через PCIe

Готовы запустить GPU-задачу?

Запустить GPU-сервер