GPU Hardware

GPU passthrough

Прямой доступ виртуальной машины к физическому GPU без виртуализации CUDA-стека.

Что такое GPU passthrough

GPU passthrough (PCI passthrough, VFIO) — технология виртуализации, позволяющая предоставить виртуальной машине прямой доступ к физическому GPU с полной производительностью. В отличие от виртуализованного GPU (vGPU), при passthrough ВМ видит GPU как настоящее PCI-устройство и устанавливает в него собственные NVIDIA-драйверы.

Это основной механизм, через который облачные провайдеры (включая Vast.ai) предоставляют GPU-ресурсы: пользователь получает ВМ или контейнер с GPU passthrough — эффективность вычислений идентична bare metal.

Как работает

[Физический сервер]
├── Гипервизор (KVM/QEMU или контейнер)
├── GPU → VFIO-PCI driver (изолирует GPU от хоста)
└── VM/Container ← получает /dev/nvidia0 как будто GPU физически вставлен

Изоляция обеспечивается через IOMMU (Intel VT-d / AMD Vi): GPU и его DMA-доступ ограничены конкретной ВМ.

Сравнение подходов виртуализации GPU

Подход Производительность Изоляция Множественность
GPU passthrough ~100% bare metal Полная 1 GPU → 1 VM
NVIDIA vGPU ~80–95% Частичная 1 GPU → N VM
MIG ~100% (аппаратно) Полная 1 GPU → 7 VM
CUDA MPS ~95% Минимальная Совместный доступ

Для пользователя GPU-инстанса

С точки зрения пользователя passthrough прозрачен: nvidia-smi показывает реальный GPU, CUDA работает нативно, нет overhead от виртуализации.

Связанные термины

  • MIG — аппаратное разделение GPU для нескольких пользователей
  • GPU-инстанс — пользовательский контекст, получаемый через passthrough
  • CUDA — стек, работающий нативно при passthrough

Готовы запустить GPU-задачу?

Запустить GPU-сервер