GPU passthrough
Прямой доступ виртуальной машины к физическому GPU без виртуализации CUDA-стека.
Что такое GPU passthrough
GPU passthrough (PCI passthrough, VFIO) — технология виртуализации, позволяющая предоставить виртуальной машине прямой доступ к физическому GPU с полной производительностью. В отличие от виртуализованного GPU (vGPU), при passthrough ВМ видит GPU как настоящее PCI-устройство и устанавливает в него собственные NVIDIA-драйверы.
Это основной механизм, через который облачные провайдеры (включая Vast.ai) предоставляют GPU-ресурсы: пользователь получает ВМ или контейнер с GPU passthrough — эффективность вычислений идентична bare metal.
Как работает
[Физический сервер]
├── Гипервизор (KVM/QEMU или контейнер)
├── GPU → VFIO-PCI driver (изолирует GPU от хоста)
└── VM/Container ← получает /dev/nvidia0 как будто GPU физически вставлен
Изоляция обеспечивается через IOMMU (Intel VT-d / AMD Vi): GPU и его DMA-доступ ограничены конкретной ВМ.
Сравнение подходов виртуализации GPU
| Подход | Производительность | Изоляция | Множественность |
|---|---|---|---|
| GPU passthrough | ~100% bare metal | Полная | 1 GPU → 1 VM |
| NVIDIA vGPU | ~80–95% | Частичная | 1 GPU → N VM |
| MIG | ~100% (аппаратно) | Полная | 1 GPU → 7 VM |
| CUDA MPS | ~95% | Минимальная | Совместный доступ |
Для пользователя GPU-инстанса
С точки зрения пользователя passthrough прозрачен: nvidia-smi показывает реальный GPU, CUDA работает нативно, нет overhead от виртуализации.
Связанные термины
- MIG — аппаратное разделение GPU для нескольких пользователей
- GPU-инстанс — пользовательский контекст, получаемый через passthrough
- CUDA — стек, работающий нативно при passthrough
Готовы запустить GPU-задачу?
Запустить GPU-сервер