Как начать пользоваться Open WebUI -- бесплатный интерфейс для локальных AI-моделей

Open WebUI -- это ChatGPT-подобный интерфейс для запуска AI-моделей на своём компьютере через Ollama. Полный гайд: установка, настройка, ключевые функции и советы.

2026-05-31·7 мин

Open WebUI v0.10.x -- крупное обновление (июль 2026)

1 июля 2026 года вышла версия Open WebUI v0.10.2. Новые возможности: Computer Agent (доступ к файлам, терминалу, Git, браузеру); гибридный поиск в pgvector; внешние источники знаний; новая система памяти с разделением на долгосрочную и контекстную; Event Function плагины; Webhooks. Обновление: docker pull ghcr.io/open-webui/open-webui:latest && docker restart open-webui.

Обновления Open WebUI (2026)

Нативное десктопное приложение Open WebUI (март 2026): отдельные приложения для macOS, Windows и Linux без необходимости Docker или браузера. Устанавливается как обычное приложение, запускает встроенный Ollama если он не запущен. Поддержка system tray для быстрого доступа.

Calendar workspace: новый раздел для планирования с AI. Создавайте события через диалог, задавайте напоминания, синхронизация с Google Calendar и Apple Calendar. AI помогает планировать задачи на основе вашего расписания и задаёт уточняющие вопросы перед созданием встречи.

Open Terminal (встроен в Open WebUI): запуск bash команд через AI агент прямо из интерфейса. Агент читает вывод команд и интерпретирует результаты. Для системного администрирования и DevOps - возможность описать задачу словами и получить готовую команду с объяснением.

MariaDB Vector Store: Open WebUI теперь поддерживает MariaDB как vector database для RAG. Альтернатива встроенному Chroma DB для production deployment. Qdrant и Milvus также поддерживаются. Настройка через переменные окружения VECTOR_DB=mariadb в docker-compose.

Что это и для кого

Open WebUI -- это бесплатный самохостируемый веб-интерфейс для работы с AI-моделями прямо на вашем компьютере. Если вы уже установили Ollama или LM Studio и запускаете модели вроде Llama 4, Qwen 3 или Mistral локально -- Open WebUI добавляет к ним удобный визуальный интерфейс, похожий на ChatGPT, но полностью под вашим контролем.

Инструмент создан для тех, кто ценит конфиденциальность: все данные остаются на вашем устройстве и не уходят на сторонние серверы. Это особенно важно для бизнеса, работающего с чувствительными документами, и для частных пользователей, которые не хотят передавать свои запросы и файлы облачным сервисам.

Open WebUI популярен среди разработчиков, исследователей и технически подготовленных пользователей. Согласно данным на 2026 год, репозиторий проекта на GitHub набрал более 55 000 звезд -- это один из самых популярных open-source проектов в сфере локального AI. Но несмотря на техническое происхождение, пользоваться им может любой, кто готов следовать инструкции по установке.

Главное преимущество перед просто запуском Ollama в командной строке -- это полноценный визуальный интерфейс с историей чатов, загрузкой документов, переключением моделей в один клик, голосовым вводом и возможностью создавать несколько профилей с разными настройками. По сути, вы получаете приватный ChatGPT, работающий на вашем железе.

Ещё одна важная возможность -- подключение сразу к нескольким AI-бэкендам: Ollama для локальных моделей, OpenAI API для GPT-моделей, Claude через Anthropic API, а также Groq, Mistral API и другие облачные провайдеры. Всё это доступно в одном окне браузера, без необходимости переключаться между разными сайтами и интерфейсами.

Как установить Open WebUI

Установка Open WebUI требует базовых технических навыков -- умения работать с командной строкой. Есть несколько способов установки; самый простой -- через Docker.

Способ 1: Docker (рекомендуется). Это самый быстрый путь. Убедитесь, что на вашем компьютере установлен Docker Desktop (скачивается бесплатно с docker.com для macOS и Windows). Затем откройте терминал и выполните следующую команду:

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

После выполнения команды перейдите в браузере по адресу http://localhost:3000 -- и вы увидите интерфейс Open WebUI. При первом запуске нужно создать аккаунт администратора (логин и пароль) -- этот аккаунт используется только локально и никуда не передается.

Способ 2: pip (если есть Python). Если у вас уже установлен Python версии 3.11 или выше, можно установить через pip командой: pip install open-webui. После установки запустите командой open-webui serve, затем откройте http://localhost:8080 в браузере.

Шаг после установки: подключение Ollama. Если у вас уже запущена Ollama, Open WebUI автоматически её обнаружит при первом запуске. Если Ollama ещё не установлена -- скачайте её с ollama.com и запустите нужную модель командой, например: ollama run llama4. После этого модель появится в выпадающем меню Open WebUI.

Обновление до новой версии. Для обновления через Docker выполните две команды последовательно: сначала docker pull ghcr.io/open-webui/open-webui:main, затем docker restart open-webui. Все данные -- история чатов, настройки, загруженные документы -- сохраняются при обновлении.

Первый запуск -- что попробовать

После входа в интерфейс на http://localhost:3000 вы увидите знакомый дизайн: боковая панель с историей чатов слева, основная область для переписки в центре, кнопка выбора модели вверху.

Выберите модель. В верхней части интерфейса есть выпадающее меню с доступными моделями. Если Ollama подключена и у вас скачана хотя бы одна модель -- она появится здесь. Выберите, например, llama4 или qwen3 и начните диалог. Первый запрос может отвечать немного дольше, пока модель загружается в оперативную память.

Загрузите документ. Одна из ключевых функций -- RAG (Retrieval-Augmented Generation), то есть вопросы к документам. Нажмите на иконку скрепки рядом с полем ввода и загрузите PDF, Word-документ или текстовый файл. После загрузки задайте вопрос по содержимому: например, краткое резюме этого документа или какие ключевые пункты в этом договоре. Модель ответит на основе загруженного материала.

Голосовой ввод. Нажмите иконку микрофона в поле ввода для диктовки запросов голосом. Open WebUI поддерживает транскрипцию через несколько провайдеров -- встроенный Whisper (работает локально без интернета), OpenAI Whisper API и Deepgram.

Создайте персонажа (System Prompt). Через меню настроек вы можете создать несколько чат-персонажей с разными системными промптами: например, деловой ассистент, редактор текстов или программист на Python. Каждый новый чат можно начать с нужным персонажем в один клик.

Переключайтесь между моделями. Прямо в процессе разговора можно переключиться на другую модель и сравнить ответы. Это удобно, когда нужно понять, какая из скачанных моделей лучше справляется с конкретным типом задачи -- например, кодированием, переводом или анализом текста.

Ключевые фишки

Open WebUI -- это не просто красивая обертка для командной строки. Здесь собрано множество продуманных функций для серьезной работы с AI-моделями.

Мультибэкенд в одном окне. Подключайте одновременно: Ollama для локальных моделей, OpenAI API для GPT-4o и GPT-5.5, Anthropic API для Claude, Groq для быстрого inference, Mistral API и любой другой OpenAI-совместимый эндпоинт. Переключение происходит через единый интерфейс без необходимости открывать разные сайты или приложения.

RAG -- работа с базой знаний. Встроенная функция Retrieval-Augmented Generation позволяет задавать вопросы к PDF, Word, TXT, CSV и веб-страницам. Можно создать базу знаний из нескольких документов и работать с ней как с корпоративным поисковиком с AI-ответами -- полностью локально и приватно.

Многопользовательский режим. Open WebUI поддерживает нескольких пользователей с отдельными аккаунтами, правами доступа и историями чатов. Это позволяет развернуть его на сервере внутри компании и дать доступ всей команде -- каждый работает со своими данными, не видя чужих.

Встроенный генератор изображений. Подключите AUTOMATIC1111, ComfyUI или DALL-E API и генерируйте изображения прямо из чата. Напишите описание и получите картинку без переключения между вкладками -- всё в одном интерфейсе.

Веб-поиск в чате. Интегрируется с поисковыми системами -- DuckDuckGo, Brave Search, Bing -- для получения актуальной информации прямо в разговоре с локальной моделью. Это обходит одно из главных ограничений локальных моделей: отсутствие знаний о событиях после даты обучения.

Python-функции для продвинутых. Опытные пользователи могут писать собственные функции на Python прямо в интерфейсе и подключать их к моделям как инструменты. Это позволяет создавать кастомные пайплайны обработки данных под конкретные задачи бизнеса.

Экспорт и импорт чатов. Всю историю переписки можно экспортировать в JSON или Markdown для архивирования или переноса на другое устройство. Данные остаются у вас в любом случае.

Открытый исходный код. Open WebUI полностью открыт под лицензией MIT. Это означает, что вы можете изучить код, убедиться в безопасности, форкнуть и модифицировать под свои нужды, развернуть на любой инфраструктуре без ограничений и дополнительной оплаты.

Цены и ограничения

Open WebUI полностью бесплатен. Нет ни платных тарифов, ни лимитов на использование со стороны самого Open WebUI. Вы платите только за то, что решаете использовать за ним: локальные модели через Ollama бесплатны, а платные API (OpenAI, Anthropic) тарифицируются по стандартным ценам этих провайдеров.

Системные требования. Для запуска с локальными моделями важны характеристики компьютера. Open WebUI сам по себе легкий -- достаточно 1 ГБ RAM. Но для запуска AI-моделей через Ollama нужно значительно больше: для небольших моделей с 7 миллиардами параметров (например, Mistral 3 или Llama 3.2) нужно минимум 8 ГБ RAM. Для более мощных моделей с 70 миллиардами параметров нужно 64+ ГБ RAM или видеокарта с достаточным объемом VRAM.

Техническая сложность. Первоначальная настройка требует базового владения командной строкой и понимания Docker. Для совсем неподготовленных пользователей это может быть барьером. Однако если вы уже пользуетесь Ollama или LM Studio -- добавить Open WebUI поверх них достаточно просто, следуя официальной документации на docs.openwebui.com.

Производительность. Скорость генерации ответов целиком зависит от вашего железа и выбранной модели -- Open WebUI сам по себе не замедляет и не ускоряет работу нейросети. Если Ollama работает медленно на вашем компьютере, Open WebUI эту скорость не изменит. Для комфортной работы рекомендуется процессор Apple Silicon (M1 и новее) или видеокарта NVIDIA с поддержкой CUDA и объемом VRAM от 8 ГБ.

Сравнение с альтернативами. Из аналогичных инструментов стоит упомянуть LM Studio -- он проще в установке (графический установщик, не нужен Docker) и лучше подходит для начинающих. Но Open WebUI превосходит его по функциональности: RAG, мультипользовательский режим, плагины и интеграция с несколькими API-провайдерами делают его более мощным инструментом для регулярной работы. Jan AI -- ещё одна альтернатива с десктопным приложением, но тоже менее функциональная, чем Open WebUI.

Поддержка и сообщество. Проект активно развивается -- релизы выходят регулярно, порой несколько раз в месяц. Документация на английском языке доступна на docs.openwebui.com. Русскоязычного сообщества значительно меньше, чем у коммерческих инструментов, но в Telegram-каналах, посвященных локальному AI и Ollama, можно найти помощь и ответы на частые вопросы.

Нужен ли VPN из России

Open WebUI -- это программное обеспечение с открытым исходным кодом, которое запускается полностью на вашем компьютере или сервере. Для работы с локальными моделями через Ollama VPN вообще не нужен -- интернет-соединение используется только для первоначальной загрузки программы и моделей, а сами запросы к AI никуда не отправляются.

Единственный момент, когда может потребоваться VPN -- скачивание самого Open WebUI с GitHub и образов Docker с ghcr.io. Оба сайта доступны в России без ограничений на момент написания гайда, но если у вашего провайдера есть проблемы со скоростью соединения с зарубежными сервисами -- VPN может помочь ускорить начальную загрузку.

Если вы подключаете к Open WebUI облачные API -- OpenAI, Anthropic, Groq -- нужно учитывать, что сами эти сервисы напрямую недоступны из России из-за санкционных ограничений. В этом случае Open WebUI нужно настроить для работы через прокси-сервер или запускать на VPS за рубежом. Это дополнительная настройка, но технически выполнимая для тех, кому она необходима.

Для большинства сценариев использования -- локальный AI с Ollama и моделями из открытого доступа -- никакой специальной настройки для обхода блокировок не требуется. Это один из главных практических плюсов локального AI в целом: вы не зависите от решений западных компаний о доступности их облачных сервисов в вашей стране.

Модели для Ollama скачиваются с серверов ollama.com, которые доступны из России. В случае проблем -- модели также доступны через зеркала на Hugging Face, которые обычно работают без ограничений.

Новые возможности Open WebUI (2026): нативное desktop-приложение теперь работает без Docker -- достаточно установить exe (Windows) или dmg (macOS) и запустить. Быстрый доступ к интерфейсу -- горячая клавиша Shift+Cmd+I (macOS) или Shift+Ctrl+I (Windows). Появились scheduled automations -- запуск задач по расписанию без необходимости держать браузер открытым, что удобно для регулярных обработок данных или уведомлений.

Open WebUI 0.9.6 -- обновления (2 июня 2026)

Вышла версия Open WebUI 0.9.6 (2 июня 2026). Ключевые новинки:

oikb -- синхронизация Knowledge Base (40+ источников) -- новый инструмент командной строки oikb поддерживает синхронизацию с 40+ типами источников и позволяет синхронизировать папки на вашем компьютере с KB в Open WebUI. Запустите: oikb sync ~/Documents/my-kb --webui-url http://localhost:3000. Файлы автоматически индексируются.
Вложенные папки Knowledge Base с breadcrumbs -- KB теперь поддерживает иерархическую структуру папок. Навигация через breadcrumb-навигацию в интерфейсе.
Azure OpenAI /openai/v1 endpoint -- прямая интеграция с Azure OpenAI Service. В настройках API Connections добавьте тип Azure OpenAI и укажите endpoint в формате https://your-resource.openai.azure.com/openai/v1.
oikb -- расширенная синхронизация Knowledge Base (40+ источников) -- инструмент oikb поддерживает синхронизацию с локальными директориями, GitHub (репозитории и Wiki), S3 (бакеты AWS/MinIO), Confluence (корпоративные базы знаний) и многими другими источниками (всего 40+). Пример: oikb sync --source github://org/repo --webui-url http://localhost:3000.
Поддержка Milvus как векторной базы данных -- Open WebUI v0.9.6 добавил нативную поддержку Milvus (помимо Chroma, Qdrant, MariaDB). Настройка: VECTOR_DB=milvus в docker-compose или переменных окружения.

Desktop app для Mac, Windows и Linux (нативное приложение без Docker) уже был добавлен ранее. С 0.9.6 он обновлён до актуальной версии.

Внимание перед обновлением до v0.9.6: Версия 0.9.6 содержит изменения схемы базы данных. Перед обновлением обязательно сделайте резервную копию данных: docker cp open-webui:/app/backend/data ./webui-backup-$(date +%Y%m%d). Если вы используете multi-worker конфигурацию, все воркеры должны обновиться одновременно -- поэтапное обновление может привести к несовместимости схем. После создания резервной копии:

Обновление Open WebUI через Docker: docker pull ghcr.io/open-webui/open-webui:main && docker stop open-webui && docker rm open-webui -- затем запустите с теми же параметрами, что и при первоначальной установке.

Нативное десктопное приложение Open WebUI

Нативное desktop-приложение (без Docker) -- запускается через один исполняемый файл на macOS, Windows и Linux. Горячая клавиша Shift+Cmd+I (macOS) открывает чат поверх любого окна. Автоматические обновления без необходимости вручную обновлять Docker-образ.

Scheduled Automations -- повторяющиеся AI-задачи по расписанию с историей запусков: ежедневный дайджест новостей, еженедельный анализ данных, автоматическая обработка документов. Просмотр истории выполнения задач в разделе Automations. Calendar Workspace -- интеграция с календарём для напоминаний и подготовки к встречам с помощью AI.

Предупреждение безопасности -- Open WebUI v0.9.6: Версия v0.9.6 содержала критические уязвимости: SSRF (Server-Side Request Forgery) и XSS (Cross-Site Scripting). Патчи выпущены в v0.9.6.1 и последующих версиях. Если вы используете Open WebUI v0.9.6, обновитесь немедленно: docker pull ghcr.io/open-webui/open-webui:main. Для экземпляров Open WebUI с публичным доступом (не только localhost) обновление критически важно.

Open WebUI v0.9.6: новые возможности агентного режима

Open WebUI Computer -- агентные сессии (v0.9.6): Новая интеграция Open WebUI Computer позволяет агенту работать с файловой системой, терминалом, git-репозиториями и веб-браузером в рамках единой агентной сессии. Агент видит экран, может запускать команды и работать с файлами как настоящий автоматизированный рабочий агент. Включается в настройках безопасности -- требует явного разрешения.

Hybrid Search через pgvector (v0.9.6): Поиск по базе знаний теперь использует встроенную поддержку pgvector и выполняется нативно в базе данных без загрузки данных в память. Это значительно ускоряет поиск в больших knowledge base и снижает потребление RAM при работе с объёмными корпусами документов.

CVE-2026-48710 (BadHost уязвимость): В v0.9.6 устранена критическая уязвимость BadHost, связанная с библиотекой Starlette. Уязвимость позволяла обходить проверки хоста при определённых конфигурациях. Если вы используете Open WebUI v0.9.5 или старше - обновитесь до v0.9.6 или новее для устранения этой уязвимости.

Context Compaction: оптимизация длинных разговоров

Context Compaction - настройка в Open WebUI, которая автоматически сжимает историю разговора при достижении лимита контекста. Включается в Settings - Chat - Context Compaction. Когда длина диалога приближается к максимуму контекстного окна, Open WebUI суммирует более ранние сообщения и сохраняет только ключевую информацию - разговор продолжается без потери нити, не нужно начинать новый чат. Особенно полезно при работе с моделями с ограниченным контекстом (7B, 14B) в длинных сессиях.

Этот материал подготовлен командой AI-агентов AravanaAI и проверен главным редактором.

Поделиться:Telegram X LinkedIn

Как вам материал?

Теги:AI Local Open WebUI Ollama локальный AI приватность

Хотите получать подобные материалы раньше?

Aravana Intelligence — авторская аналитика и закрытый круг для тех, кто думает на шаг вперёд.

Узнать про Intelligence

Не пропускайте важное

Еженедельный дайджест Aravana — ключевые события в AI, робототехнике и longevity.

Как начать пользоваться Agno: Python-фреймворк для создания AI-агентов

Agno (бывший phidata) - один из самых популярных Python-фреймворков для построения AI-агентов с 39k+ звезд на GitHub. Пошаговый гайд: установка, первый агент за 5 минут, мультиагентные команды и деплой в продакшн.

2026-07-14·8 мин

С чего начать·Гайд

Seedance 2.5: как начать пользоваться генератором видео от ByteDance

Seedance 2.5 от ByteDance генерирует нативное 30-секундное видео в один проход, принимает до 50 мультимодальных референсов и позволяет редактировать отдельные фрагменты без перегенерации всего клипа.

2026-07-13·7 мин

С чего начать·Гайд

ChatGPT Work: как начать пользоваться агентным рабочим столом OpenAI

9 июля 2026 OpenAI запустила ChatGPT Work -- агента, который берёт у вас целый проект, сам планирует шаги, работает часами в фоне и возвращает готовый документ, таблицу или презентацию.

2026-07-13·8 мин