Инференс

Инференс

Инференс — это доступ к языковым моделям (LLM) через единый OpenAI-совместимый API. Вы получаете один адрес и API-ключ, через которые можно обращаться к десяткам моделей — из своего кода, редактора, AI-чата или любого инструмента, поддерживающего OpenAI API.

Отдельный сервер арендовать не нужно: оплата идёт по факту использования, из баланса аккаунта — списывается стоимость обработанных токенов.

Ключевые особенности

  • OpenAI-совместимость — работает с официальными OpenAI SDK и любыми совместимыми клиентами (Cline, Continue.dev, Aider, curl и др.). Достаточно поменять базовый адрес и ключ.
  • Много моделей — один ключкаталог моделей с ценами и в личном кабинете.
  • Оплата за использование — списания идут из общего баланса, как и за серверы. Абонентской платы нет.
  • Потоковая передача — поддерживается стандартный режим stream: true.

Содержание раздела

См. также