Решения
Планировщик стоимости GPU: On‑Demand vs Interruptible
								Цель страницы. Помогает выбрать режим аренды, оценить бюджет задачи и понять, где экономия безопасна. Ниже — простая методика расчёта, чек‑лист параметров и рекомендации по профилям нагрузок.
Ключевой выбор: режим аренды
On‑Demand 
(высокий приоритет)![]()
- Фиксированная цена от хоста, высокий приоритет; инстанс работает столько, сколько нужно (в пределах лимита «maximum duration», заданного хостом на карточке оффера). Подходит для интерактива, длительных и чувствительных к прерываниям задач.
 - После остановки по инициативе пользователя/хоста данные остаются доступны на машине.
 
															
															Interruptible 
(низкий приоритет, по ставке/аукцион)![]()
- Ставка (bid) определяет приоритет; если кто‑то поставит выше или появится on‑demand на эти же ресурсы, ваш инстанс будет приостановлен (процессы завершаются). Данные сохраняются на диске; возобновление — когда ресурс снова станет доступен по вашей ставке. Требует устойчивого пайплайна с автосейвом/чекпоинтингом.
 - Переключить уже запущенный инстанс между on‑demand/interruptible нельзя — режим выбирается при создании.
 
Решение в двух шагах
- Если нужен гарантированный непрерывный прогон или критичный дедлайн — берите On‑Demand.
 - Если задача масштабируется горизонтально, допускает остановки и у вас есть чекпоинтинг — Interruptible даст существенную экономию. (Для устойчивых паттернов см. /solutions/interruptible-patterns/.)
 
Из чего складывается стоимость![]()
Тарифицируется помесячно/помесячно‑в‑часовом эквиваленте за каждый ГБ во всех состояниях, кроме offline; это значит, что за остановленные инстансы хранение тоже платное.
Базовая формула бюджета![]()
				
					R_gpu — ставка GPU ($/час)
H_active — суммарные часы активной работы
R_storage — ставка хранения ($/ГБ/мес. или эквивалент $/час)
GB — размер диска
D — дни существования инстанса (пока он не offline)
R_bw — ставка трафика ($/ТБ)
TB_in, TB_out — объёмы входящего/исходящего трафика (ТБ)
Total = (R_gpu × H_active) + (R_storage × GB × D/30) + (R_bw × (TB_in + TB_out))
 
				
			
		Ключевой выбор: режим аренды
Где экономить без потери результата![]()
Безопасно на interruptible, если:
- Задача батчевая и разбивается на шардированные куски (эмбеддинги, пакетный инференс, транскод).
 - Есть чекпоинтинг/автосейвы и быстрая перезагрузка пайплайна.
 - Легко поднять несколько маленьких инстансов вместо одного большого (горизонтальное масштабирование).
Подробнее — /solutions/interruptible-patterns/. 
Лучше on‑demand, если:
Интерактив (Jupyter, удалённые рабочие места), строгие SLA, одноузловые долгие тренировки без надёжного чекпоинтинга.
															
															Быстрый алгоритм планирования (5 шагов)![]()
- Классифицируйте нагрузку: обучение / инференс / рендер / ETL / HPC.
 - Определите допуск к прерываниям: да (берём interruptible) / нет (on‑demand).
 - Оцените ресурсы: VRAM (модель/батч), объём диска (датасеты/чекпоинты), трафик.
 - Подберите GPU‑класс:
- инференс/графика — чаще L4/L40S; крупное обучение — A100 80 GB/H100 (ориентиры).
 - для выбора смотрите профиль решения из разделов /solutions/.
 
 - инференс/графика — чаще L4/L40S; крупное обучение — A100 80 GB/H100 (ориентиры).
 
Посчитайте бюджет формулой и добавьте запас (например, +10–20% на повторные прогоны и трафик).
Типовые сценарии (как считать)![]()
- Инференс LLM‑сервера (24/7):
On‑Demand: R_gpu × 24 × 30 + R_storage × GB × 30/30 + R_bw × TB
Interruptible: та же формула, но берите H_active с учётом возможных простоев и запасом на повторный разогрев модели. - Пакетная генерация изображений (ночами):
Interruptible, несколько маленьких инстансов, каждый считает свою часть датасета; диск — минимально достаточный, чекпоинты и артефакты выгружать. - LoRA‑дотренировка (по вечерам, 3–4 часа): Interruptible с жёстким чекпоинтингом каждые N шагов; планируйте H_active как суммарные часы по всем перезапускам.
 
Резервирование (опционально)![]()
Есть режим Reserved (предоплата на длительный период) — высокая приоритетность и существенные скидки (в доках указано «до 50%», уровень зависит от провайдера/условий). Подходит, если у вас стабильная долгоживущая нагрузка.
Чек‑лист параметров![]()
- Тип задачи и SLA (интерактив/батчи/24×7).
 - Режим аренды (on‑demand/interruptible) и допуск к прерываниям (да/нет).
 - GPU‑класс/кол‑во и минимальная VRAM.
 - Объём диска (ГБ), срок жизни инстанса (дней).
 - Оценка трафика (вх/исх, ТБ).
 - План чекпоинтов/автосейвов и восстановление после прерывания.
 - Ссылки на шаблон запуска и страницу решения.
 
База знаний
Частые вопросы
Можно ли переключить созданный инстанс между on‑demand и interruptible?
Нет; режим фиксируется при создании инстанса.
Где посмотреть раздельные цены GPU/Storage/Bandwidth?
В карточке оффера/инстанса при наведении на цену — всплывающая детализация.
Плачу ли я за «loading»?
Нет, за состояние «loading» списаний нет.
Если баланс ушёл в ноль — что будет?
Инстансы останавливаются, но не уничтожаются; данные остаются, при этом продолжает списываться хранение до удаления/перевода в offline.