GPU Hardware

MIG (Multi-Instance GPU)

Технология NVIDIA для аппаратного разделения одного GPU на изолированные экземпляры.

Что такое MIG

MIG (Multi-Instance GPU) — технология NVIDIA, позволяющая разделить один физический GPU A100 или H100 на до 7 полностью изолированных экземпляров. Каждый экземпляр имеет выделенные: SM (Streaming Multiprocessors), VRAM, пропускную способность памяти и кеши — изоляция аппаратная, а не программная.

Это позволяет предоставлять гарантированные ресурсы разным задачам или пользователям без конкуренции.

Конфигурации для A100 80GB

Профиль VRAM Число экземпляров Применение
1g.10gb 10 ГБ до 7 Эксперименты, маленькие модели
2g.20gb 20 ГБ до 3 Модели 7B с квантизацией
3g.40gb 40 ГБ до 2 Модели 13B
7g.80gb 80 ГБ 1 Полный GPU

Управление MIG

# Включить MIG-режим
sudo nvidia-smi -i 0 --mig-mode=1

# Создать 7 экземпляров по 10 ГБ
sudo nvidia-smi mig -cgi 19,19,19,19,19,19,19 -C

# Список экземпляров
nvidia-smi -L
# → GPU 0: A100 80GB (MIG 1g.10gb Device 0)
# → GPU 0: A100 80GB (MIG 1g.10gb Device 1) ...

# Запустить vLLM в конкретном MIG-экземпляре
CUDA_VISIBLE_DEVICES=MIG-UUID docker run ...

Когда использовать MIG

  • Облачный сервис — предоставление изолированных GPU разным пользователям на одном A100
  • Разные модели — 7 маленьких задач инференса на одном GPU
  • CI/CD — тестирование ML-кода на выделенном экземпляре

MIG недоступен на RTX/Quadro картах и не поддерживается для обучения на нескольких экземплярах одновременно (экземпляры изолированы).

Связанные термины

  • NVIDIA A100 — основной GPU с поддержкой MIG
  • NVIDIA H100 — также поддерживает MIG
  • VRAM — ресурс, разделяемый MIG

Готовы запустить GPU-задачу?

Запустить GPU-сервер