Как быстро можно запустить NVIDIA A100?

Инстанс с NVIDIA A100 запускается за 30 секунд после оплаты. Вы получаете SSH-доступ и ссылку на Jupyter Notebook. Никаких заявок и ожидания — всё автоматически.

Какие способы оплаты доступны?

Принимаем банковские карты РФ (Visa, Mastercard, МИР). Для юридических лиц — оплата по счёту с договором и закрывающими документами (акт, счёт-фактура). НДС включён в стоимость.

A100 40 ГБ или 80 ГБ — какой выбрать?

Если ваша модель не превышает ~35 ГБ весов, A100 40 ГБ будет дешевле и достаточно. Для моделей 30B+ в float16, многозадачных сценариев или когда нужен большой буфер KV-кеша для длинного контекста — берите 80 ГБ.

Подходит ли A100 для fine-tuning Llama 3 70B?

Да. Llama 3 70B в float16 занимает около 140 ГБ, что требует двух A100 по 80 ГБ с NVLink. В 8-bit квантизации модель помещается в один A100 80 ГБ с небольшим запасом.

Какой объём VRAM доступен на CloudCompute?

Мы предоставляем A100 в конфигурациях 40 ГБ и 80 ГБ. Актуальная доступность и цены отображаются в таблице выше.

Поддерживает ли A100 NVLink?

Да. A100 поддерживает NVLink третьего поколения, позволяя объединять до 8 карт в единое адресное пространство памяти (до 640 ГБ).

Аренда NVIDIA A100

80 ГБ VRAM · Ampere

Арендовать

Оплата картой РФ

Договор и документы

Запуск за 30 секунд

Поддержка на русском

Конфигурации и цены

По запросу — свяжитесь с нами

Конфигурации для этой GPU уточняйте напрямую.

Связаться с нами

Технические характеристики

Архитектура: Ampere
VRAM: 80 ГБ
CUDA-ядра: 6912
FP32 TFLOPS: 19.5
FP16 TFLOPS: 312
Пропускная способность памяти: 2000 ГБ/с
TDP: 400 Вт
NVLink: Да

Подходит для

Обучение LLM Fine-tuning HPC Научные вычисления Inference больших моделей RAG

NVIDIA A100 на архитектуре Ampere — профессиональная GPU для обучения и inference крупных нейросетей. Доступна с 40 ГБ и 80 ГБ HBM2e памяти, поддерживает NVLink для многокарточных конфигураций.

Сколько моделей поместится

Приблизительная оценка: params × precision × overhead < VRAM

Llama 3.1 8B (fp16)

~16 ГБ, помещается с запасом

Llama 3.1 70B (fp16)

~168 ГБ — не помещается на одну карту, нужен H200 или 2× A100

Llama 3.1 70B (fp8)

~84 ГБ с overhead — превышает 80 ГБ; используйте 4-bit квантизацию (~40 ГБ)

Mistral 7B (fp16)

~17 ГБ, помещается с запасом

Stable Diffusion XL

~10 ГБ

Whisper large-v3

~3 ГБ

Сравнение с похожими GPU

Характеристика	NVIDIA A100	NVIDIA H100 SXM	NVIDIA RTX 4090	NVIDIA RTX 3090
VRAM	80 ГБ	80 ГБ	24 ГБ	24 ГБ
от ₽/час	—	—	75.53 ₽	27.79 ₽
Подходит для	Обучение LLM, Fine-tuning	Обучение LLM, Fine-tuning больших моделей	LLM inference, Генерация изображений	LLM inference, Генерация изображений
Страница	Текущая	Открыть →	Открыть →	Открыть →

Часто задаваемые вопросы

Готовы начать?

Почасовая тарификация. Без подписки. Запуск за 30 секунд.

Создать аккаунт