Инференс

LLM по API — один ключ, все модели

OpenAI-совместимый API, оплата за токены в рублях с карты РФ. Подключите из кода, редактора или нашего AI-чата.

curl https://app.cloudcompute.ru/api/v1/chat/completions \
  -H "Authorization: Bearer YOUR_KEY" \
  -H "Content-Type: application/json" \
  -d '{"model":"openai/gpt-4o-mini","messages":[{"role":"user","content":"Привет!"}]}'

Быстрый старт

01

Создайте аккаунт

Зарегистрируйтесь и пополните баланс — абонентской платы нет.

02

Получите API-ключ

В панели управления создайте ключ в разделе «API-доступ».

03

Смените base_url

В OpenAI SDK или curl укажите наш endpoint вместо api.openai.com.

Популярные модели

Весь каталог →
inclusionAI: Ling-2.6-flash
inclusionai/ling-2.6-flash
Ввод: 0.99 ₽ / 1M
IBM: Granite 4.0 Micro
ibm-granite/granite-4.0-h-micro
Ввод: 1.68 ₽ / 1M
Meta: Llama 3.1 8B Instruct
meta-llama/llama-3.1-8b-instruct
Ввод: 1.98 ₽ / 1M
Mistral: Mistral Nemo
mistralai/mistral-nemo
Ввод: 1.98 ₽ / 1M
Meta: Llama 3.2 1B Instruct
meta-llama/llama-3.2-1b-instruct
Ввод: 2.67 ₽ / 1M
OpenAI: gpt-oss-20b
openai/gpt-oss-20b
Ввод: 2.86 ₽ / 1M

Self-hosting на своём GPU? Смотрите базу open-source моделей с требованиями к VRAM.

Открыть панель API