Open WebUI + Ollama

Веб-интерфейс для общения с LLM — ChatGPT-подобный UI с локальными моделями через Ollama.

LLM-инференс Linux от 16 ГБ VRAM

Для кого

Пользователи, которые хотят ChatGPT-подобный интерфейс с локальными моделями — для приватности, тестирования или демонстраций.

Что внутри

Open WebUI — веб-интерфейс с историей чатов, мультимодальностью и загрузкой документов
Ollama — управление и запуск моделей одной командой (ollama run llama3)
Поддержка моделей из библиотеки Ollama: Llama 3, Mistral, Phi, Gemma и др.

Как начать

Запустите инстанс с этим шаблоном
Откройте веб-интерфейс в браузере
Скачайте модель: ollama pull llama3 — и начните диалог

Рекомендации по GPU

16 ГБ VRAM — модели 7B–8B
24 ГБ VRAM — модели до 34B, несколько моделей

Предустановленное ПО

Ubuntu 22.04 CUDA 12.x Open WebUI 0.8 Ollama

Рекомендуемые GPU

RTX 4090 RTX 3090 A100 40GB

Подробное руководство: читать в разделе «Решения» →

Готовы запустить Open WebUI + Ollama?

Запустить GPU-сервер