Инференс
LLM по API — один ключ, все модели
OpenAI-совместимый API, оплата за токены в рублях с карты РФ. Подключите из кода, редактора или нашего AI-чата.
curl https://app.cloudcompute.ru/api/v1/chat/completions \
-H "Authorization: Bearer YOUR_KEY" \
-H "Content-Type: application/json" \
-d '{"model":"openai/gpt-4o-mini","messages":[{"role":"user","content":"Привет!"}]}'Быстрый старт
01
Создайте аккаунт
Зарегистрируйтесь и пополните баланс — абонентской платы нет.
02
Получите API-ключ
В панели управления создайте ключ в разделе «API-доступ».
03
Смените base_url
В OpenAI SDK или curl укажите наш endpoint вместо api.openai.com.
Популярные модели
Весь каталог →inclusionAI: Ling-2.6-flash
inclusionai/ling-2.6-flash
Ввод: 0.99 ₽ / 1M
IBM: Granite 4.0 Micro
ibm-granite/granite-4.0-h-micro
Ввод: 1.68 ₽ / 1M
Meta: Llama 3.1 8B Instruct
meta-llama/llama-3.1-8b-instruct
Ввод: 1.98 ₽ / 1M
Mistral: Mistral Nemo
mistralai/mistral-nemo
Ввод: 1.98 ₽ / 1M
Meta: Llama 3.2 1B Instruct
meta-llama/llama-3.2-1b-instruct
Ввод: 2.67 ₽ / 1M
OpenAI: gpt-oss-20b
openai/gpt-oss-20b
Ввод: 2.86 ₽ / 1M
Self-hosting на своём GPU? Смотрите базу open-source моделей с требованиями к VRAM.
Открыть панель API