GPU Hardware

datacenter GPU

GPU, спроектированный для серверных стоек: с ECC, большим VRAM и поддержкой multi-GPU.

Что такое datacenter GPU

Datacenter GPU (серверный GPU) — класс ускорителей, разработанных специально для эксплуатации в дата-центрах. В отличие от потребительских RTX, они отличаются:

ECC памятью — аппаратная коррекция ошибок для длительных вычислений
Большим объёмом VRAM — 40–192 ГБ для больших моделей
HBM-памятью — пропускная способность в разы выше GDDR6
NVLink — высокоскоростное соединение между несколькими GPU
MIG — разделение на изолированные экземпляры (A100, H100)
Форм-фактором — PCIe full-height или SXM для систем типа DGX
Сертификацией для 24/7 — проектируется для непрерывной работы

Серверные vs потребительские GPU

	Серверные (A100, H100)	Потребительские (RTX 4090)
VRAM	40–80 ГБ	24 ГБ
Тип памяти	HBM2e/HBM3	GDDR6X
ECC	Есть	Нет
NVLink	Есть	Нет
Стоимость	$10K–$30K	$1.5–2K
$/TFLOPS FP16	Выше	Ниже
Лучший сценарий	Production, 70B+, multi-GPU	Разработка, 7–13B, обрезка затрат

Когда серверный GPU необходим

Обучение модели от 30B параметров
Production-инференс с ECC-гарантиями
Долгосрочные вычисления (дни, недели)
Multi-GPU конфигурации с NVLink

Когда потребительские GPU достаточны

Разработка и эксперименты
Инференс до 13B BF16 или 70B AWQ
Fine-tuning с QLoRA/LoRA
Генерация изображений

Связанные термины

NVIDIA A100, H100 — основные серверные GPU
ECC memory — ключевая особенность серверных GPU
MIG — деление серверных GPU
NVIDIA RTX 4090 — потребительская альтернатива

Готовы запустить GPU-задачу?

Запустить GPU-сервер