Как запустить Stable Diffusion на своём компьютере: бесплатная генерация картинок

Stable Diffusion — бесплатный AI-генератор с открытым кодом. Работает локально на вашем компьютере, без подписок и ограничений. Показываем, как установить.

Aravana··2 мин

Обновления Stable Diffusion (2026)

SD 3.5 Large Turbo через NVIDIA NIM microservice: развёртывание через NVIDIA API Catalog, оптимизировано TensorRT. Скорость генерации 2x по сравнению с базовым SD 3.5 Large. NIM можно запустить локально на RTX 4090 или через облако NVIDIA. Endpoint совместим с OpenAI API формат, что позволяет подключить к любому клиенту.

GGUF квантизация для SD 3.5: теперь SD 3.5 Medium запускается в 4-bit GGUF формате через ComfyUI на видеокартах с 8 ГБ VRAM (RTX 3060/4060). Качество близко к fp16 при вдвое меньшем потреблении памяти. Модели доступны на Hugging Face в gguf ветках репозиториев.

ComfyUI обновление (2026): нативная поддержка SD 3.5 NIM endpoint, улучшенный manager для установки нод, новый интерфейс для работы с потоками. ComfyUI Desktop Version 1.0 для Windows/Mac (вышел из бета-версии) убирает необходимость в командной строке - установка и запуск через GUI. Version 1.0 - первый стабильный релиз десктопного клиента.

Системные требования для локального запуска на середину 2026 года: SD 3.5 Medium (2.5B параметров) - 6 ГБ VRAM, SD 3.5 Large (8B) - 12 ГБ VRAM, FLUX.1 dev (12B) - 16 ГБ VRAM в fp8. На Apple Silicon (M3/M4): через MLX framework все модели работают через унифицированную память.

Что такое Stable Diffusion

Stable Diffusion -- AI-генератор изображений с полностью открытым кодом. В отличие от Midjourney или DALL-E, он работает локально на вашем компьютере -- бесплатно, без подписок, без ограничений. Вы можете генерировать сколько угодно картинок, обучать свои модели и контролировать каждый параметр. Это инструмент для тех, кто хочет максимальный контроль и не боится технической настройки.

Актуальная версия: Stable Diffusion 4 (SD4)

Актуальная флагманская версия -- Stable Diffusion 4 (SD4), выпущенная 6 апреля 2026 года. SD4 построен на архитектуре DiT (Diffusion Transformer) и поддерживает нативное разрешение 4K. Выходит в двух вариантах: SD4 Base (открытые веса, Apache 2.0) и SD4 Ultra (максимальное качество). Предыдущая версия SD 3.5 также доступна и поддерживается.

  • SD 3.5 Large: полноразмерная модель с 8 млрд параметров, лучшее качество изображений, требует 16+ ГБ VRAM.
  • SD 3.5 Large Turbo: дистиллированная версия, в 2-4 раза быстрее при схожем качестве, требует 12+ ГБ VRAM.

SD 3.5 значительно лучше предыдущих версий в следующем: точное следование промптам, улучшенное качество текста на изображениях, более реалистичные человеческие руки и лица, лучшая цветопередача. Модели доступны на Hugging Face под лицензией, разрешающей коммерческое использование.

Требования к компьютеру

  • Видеокарта (GPU): NVIDIA с 8+ ГБ VRAM для базовых моделей (SD 1.5, SDXL), 12-16+ ГБ для SD 3.5. AMD работает, но медленнее.
  • Оперативная память: 16+ ГБ RAM.
  • Диск: 10-20+ ГБ свободного места (модели весят 4-8 ГБ).
  • Mac: Работает на M1/M2/M3/M4 через MPS -- медленнее, чем на NVIDIA, но полностью функционально.

Доступ из России

Stable Diffusion работает локально. VPN не нужен.

Как установить (самый простой способ)

ComfyUI (рекомендуемый)

Шаг 1. Скачайте ComfyUI с GitHub. Для Windows есть готовый портативный пакет.

Шаг 2. Скачайте модель SD 3.5 Large Turbo с Hugging Face и положите в папку models/checkpoints.

Шаг 3. Запустите ComfyUI -- откроется интерфейс в браузере.

Шаг 4. Введите промпт и нажмите Queue Prompt.

Automatic1111 (WebUI)

Альтернативный интерфейс. Установка через Git: клонируйте репозиторий, запустите webui.sh (Mac/Linux) или webui-user.bat (Windows). Хорошо работает с SD 1.5 и SDXL.

Онлайн-альтернативы (без установки)

  • Stability AI -- официальный сервис с API доступом к SD 3.5.
  • Clipdrop (от Stability AI) -- бесплатные генерации в браузере.
  • CivitAI -- платформа сообщества с тысячами кастомных моделей.

Что выбрать: SD 3.5, SDXL или SD 1.5?

  • SD 3.5 Large/Turbo -- лучшее качество, но требует мощное железо (12+ ГБ VRAM). Рекомендуется для RTX 3090/4090.
  • Stable Diffusion XL (SDXL) -- хороший баланс качества и скорости, требует 8+ ГБ VRAM. Хорошо поддерживается LoRA.
  • SD 1.5 -- самая широкая экосистема моделей и LoRA, работает на 4-6 ГБ VRAM. Хорошо для старых видеокарт.

5 советов

1. Начните с ComfyUI. Он быстрее, гибче и активнее развивается, чем Automatic1111.

2. Для старта -- SDXL или SD 3.5 Turbo. SDXL хорош для большинства задач при 8 ГБ VRAM, SD 3.5 Turbo -- для лучшего качества при 12 ГБ+.

3. Исследуйте модели на CivitAI. На civitai.com тысячи кастомных моделей и стилей.

4. Используйте LoRA. Маленькие дополнения к модели, которые добавляют конкретный стиль или персонажа -- легко установить.

5. Если компьютер слабый -- используйте облако. Google Colab, RunPod, Vast.ai -- можно арендовать GPU за несколько центов в час.

SD 3.5 Medium с 2.6 миллиардами параметров оптимизирован специально для потребительского оборудования. В отличие от полного SD 3.5 Large (8B параметров), Medium запускается на видеокартах с 8 ГБ VRAM и даже на Apple Silicon через MPS. Качество изображений сопоставимо с Large для большинства бытовых сценариев.

Forge UI стал основным рекомендуемым веб-интерфейсом, заменив устаревший AUTOMATIC1111 WebUI. Forge построен на той же кодовой базе, но оптимизирован для новых архитектур SD 3.x и FLUX. Он работает быстрее, потребляет меньше памяти и лучше поддерживает современные расширения. Для перехода достаточно перенести модели из папки checkpoints.

SV4D 2.0 - обновлённая модель для генерации видео из изображений. Новая версия создаёт более плавные трёхмерные обходы объектов с 360-градусным покрытием и поддерживает входные изображения разрешением до 4K. FLUX.2 также рекомендуется как современная альтернатива SD для задач, где важны скорость и точность текста.

Forge UI -- рекомендованная замена Automatic1111

Automatic1111 (A1111) перешёл в статус legacy/unmaintained -- разработка остановлена. Рекомендованная современная замена -- Forge UI (форк A1111 от lllyasviel): активно поддерживается, оптимизирован для Stable Diffusion 3 и FLUX, работает быстрее A1111 на 20-40%. Установка Forge: git clone https://github.com/lllyasviel/stable-diffusion-webui-forge -- далее запустите webui-user.bat (Windows) или webui.sh (Linux/Mac). Интерфейс и большинство расширений совместимы с A1111.

ComfyUI получил поддержку Wan 2.6/2.7 Video -- для генерации видео из текста прямо в ComfyUI без дополнительных инструментов. Wan 2.6/2.7 значительно превосходит предыдущие версии по качеству движения и следованию промпту. Для запуска: установите ComfyUI Manager, найдите и установите Wan 2.6/2.7 workflow из коллекции сообщества.

Актуальный статус (июнь 2026): Stable Diffusion 4 (SD4) -- текущая флагманская версия, выпущенная 6 апреля 2026 года. SD4 Base с открытыми весами (Apache 2.0) доступен для локального запуска. SD4 Ultra -- для максимального качества. Поддержка в ComfyUI и Forge UI уже доступна.

Примечание по конкурентам (май 2026): DALL-E 3 выведен из эксплуатации 12 мая 2026 года, его заменяет GPT Image 2. Текущая версия Midjourney - V8.1 (флаг --v 8.1). Stable Diffusion 3.5 остаётся актуальным выбором для локального запуска.

Требования к видеокарте: подробно

Видеокарта (GPU) -- ключевой компонент для запуска Stable Diffusion. Вот точные требования в зависимости от модели:

  • 4 ГБ VRAM (минимум): Запускает SD 1.5 в пониженном разрешении (512x512). SDXL и SD 3.5 не работают. Подходит для знакомства с технологией, но ограниченно практично.
  • 8 ГБ VRAM (рекомендуется для начала): SDXL работает стабильно, SD 3.5 Medium -- с осторожностью. Разрешение до 1024x1024. Большинство бюджетных карт NVIDIA (RTX 3060, 4060) попадают в этот диапазон.
  • 12 ГБ VRAM (комфортно): SD 3.5 Large работает нормально. Разрешение до 1024x1024, быстрее и стабильнее, чем на 8 ГБ.
  • 16+ ГБ VRAM (оптимально для SD 3.5): SD 3.5 Large Turbo запускается в полную силу. Можно работать с SD 3.5 Large в разрешении 1536x1536 и выше.
  • 24+ ГБ VRAM: Необходим для FLUX.1 Pro/Dev и SD 4 Ultra. RTX 4090, RTX 6000 Ada.

Карты AMD и Apple Silicon (M1/M2/M3) тоже поддерживаются, но с ограничениями. ComfyUI работает на Apple Silicon через MPS backend, производительность ниже, чем у сопоставимых NVIDIA.

Установка ComfyUI: пошаговая инструкция

ComfyUI -- рекомендуемый интерфейс для работы с Stable Diffusion. Вот точные шаги установки:

Шаг 1. Установите зависимости. Убедитесь, что установлены: Python 3.10-3.12, Git, CUDA Toolkit (для NVIDIA). На Windows можно использовать готовый portable-дистрибутив с официального GitHub.

Шаг 2. Клонируйте репозиторий:
git clone https://github.com/comfyanonymous/ComfyUI.git
cd ComfyUI

Шаг 3. Установите зависимости Python:
pip install -r requirements.txt
Для NVIDIA: pip install torch torchvision --index-url https://download.pytorch.org/whl/cu121

Шаг 4. Скачайте модель. Поместите файл модели (.safetensors) в папку models/checkpoints/. Для SD 3.5 Medium: скачайте с Hugging Face (stabilityai/stable-diffusion-3.5-medium).

Шаг 5. Запустите:
python main.py
Откроется браузер на адресе http://127.0.0.1:8188. Интерфейс -- нодовый граф, где каждый блок -- шаг генерации.

Сравнение моделей: SD 3.5 Medium vs Large vs SDXL

Какую модель выбрать -- зависит от вашего железа и задач:

  • SDXL (8.6B параметров): Требует 8 ГБ VRAM. Скорость генерации при 8 ГБ -- 15-30 секунд. Отличное качество для большинства задач. Огромная экосистема LoRA и расширений. Лучший выбор для начинающих с хорошей видеокартой.
  • SD 3.5 Medium (2.6B параметров): Требует 6-8 ГБ VRAM. Компактнее SDXL, быстрее на слабом железе. Лучше следует промптам и работает с текстом на изображениях. Рекомендован как стартовая точка для SD 3.5.
  • SD 3.5 Large (8B параметров): Требует 12-16 ГБ VRAM. Наилучшее качество из линейки SD 3.5: детализация, анатомия, сложные сцены. Медленнее Medium, но результат значительно лучше.
  • SD 3.5 Large Turbo: Версия Large с дистилляцией -- генерирует за 4-8 шагов вместо 20-50, в 3-5 раз быстрее. Незначительно уступает Large по качеству.

LoRA: что это и как использовать

LoRA (Low-Rank Adaptation) -- небольшие дополнения к базовой модели (обычно 10-200 МБ), которые добавляют конкретный стиль, персонажа или объект. Не меняют основную модель -- просто «накладываются» поверх.

Примеры использования LoRA: добавить аниме-стиль к реалистичной модели, воспроизвести внешность конкретного персонажа, создавать изображения в стиле определённого художника, генерировать продуктовые фото в фирменном стиле бренда.

Как использовать LoRA в ComfyUI:

  • Скачайте LoRA-файл (.safetensors) с CivitAI или Hugging Face
  • Поместите в папку models/loras/
  • В ComfyUI добавьте нод Load LoRA между нодами модели и клиппера
  • Укажите имя файла и strength (вес): 0.5-0.8 для тонкого влияния, 1.0+ для сильного

В Automatic1111 / Forge UI синтаксис другой -- добавьте в промпт: <lora:имя_файла:вес>, например: <lora:anime_style:0.7>. Можно применять несколько LoRA одновременно.

Первая генерация: от запуска до результата

Пошаговый сценарий для первого запуска на ComfyUI:

  • Запустите ComfyUI командой python main.py -- откроется браузер.
  • Загрузите дефолтный workflow (он уже есть в интерфейсе -- базовый txt2img).
  • Введите позитивный промпт: опишите желаемое изображение на английском. Пример: a serene mountain landscape at sunset, golden hour, photorealistic, highly detailed
  • Введите негативный промпт: укажите, чего быть не должно. Пример: blurry, low quality, watermark, text, deformed
  • Выберите модель в ноде Load Checkpoint.
  • Настройте параметры: Steps 20-30, CFG Scale 7, размер 1024x1024 для SDXL / 512x512 для SD 1.5.
  • Нажмите Queue Prompt -- генерация начнётся. Первая обычно занимает дольше из-за загрузки модели в память.

После первой успешной генерации: сохраните понравившийся промпт, изменяйте seed для вариаций, постепенно добавляйте новые ноды для контроля результата.

Stable Virtual Camera. Stability AI выпустила Stable Virtual Camera -- инструмент преобразования 2D-изображений в иммерсивное 3D-видео с управлением глубиной и перспективой. Это позволяет создавать эффект «пролёта сквозь» статичное изображение без дополнительного 3D-моделирования.

Stable Audio 3.0 (май 2026). В мае 2026 года Stability AI выпустила Stable Audio 3.0 -- семейство из 4 моделей для генерации музыки длиной до 6 минут. Модели обучены на лицензионных данных. Модели малого и среднего размера доступны с открытыми весами, что позволяет запускать их локально. Флагманская модель большего размера доступна через API.

Stable Diffusion 4 (апрель 2026)

6 апреля 2026 года Stability AI анонсировала Stable Diffusion 4 (SD4) -- следующее поколение генератора изображений с принципиально новой архитектурой. SD4 переходит с U-Net на DiT (Diffusion Transformer) -- ту же архитектуру, которую используют FLUX и SD 3.x. Это улучшает масштабируемость, качество деталей и следование промптам.

SD4 выходит в двух вариантах:

  • SD4 Base: открытые веса (Apache 2.0), локальный запуск, сопоставимо с SD 3.5 Large по VRAM-требованиям. Рекомендуется для экспериментов и кастомизации.
  • SD4 Ultra: максимальное качество, нативная генерация в разрешении 4K, доступна через API Stability AI. Ориентирована на профессиональное использование.

SD4 вышел в полноценный релиз: весовые файлы SD4 Base (Apache 2.0) и SD4 Pro доступны для скачивания. Поддержка в ComfyUI и Forge UI реализована. SD4 Base запускается на GPU от 8 ГБ VRAM (с оптимизацией), SD4 Pro требует 16+ ГБ VRAM.

Новые возможности SD4 (июнь 2026). Для Stable Diffusion 4 вышли новые варианты ControlNet: Depth-XL (управление глубиной сцены для реалистичных трёхмерных композиций), Normal-XL (карты нормалей для точного контроля освещения и рельефа поверхностей), Recolor (перекрашивание изображений с сохранением структуры). Установка через ComfyUI Manager: найдите «ControlNet SD4» в разделе Install Models. Дополнительно: SD4-Video запланирован на второе полугодие 2026 года -- видеогенерация на базе архитектуры DiT с нативной поддержкой временной согласованности кадров.

Новые ControlNet для SD 3.5 Large (июнь 2026). Для Stable Diffusion 3.5 Large выпущены три новые ControlNet модели: Blur (генерация с контролем чёткости - полезно для боке-эффектов и имитации глубины резкости), Canny (детектирование краёв для точного сохранения контуров объектов при рестайлинге) и Depth (карта глубины для трёхмерной композиции сцены). Все три модели устанавливаются через ComfyUI Manager в разделе Install Models - ищите по тегу "ControlNet SD3.5". Эти модели отличаются от аналогичных для SD1.5 и SDXL: оптимизированы под DiT-архитектуру SD 3.5 Large.

Этот материал подготовлен командой AI-агентов AravanaAI и проверен главным редактором.

Тип материала: research

Поделиться:TelegramXLinkedIn
Как вам материал?

Читайте также

Хотите получать подобные материалы раньше?

Aravana Intelligence — авторская аналитика и закрытый круг для тех, кто думает на шаг вперёд.

Узнать про Intelligence

Не пропускайте важное

Еженедельный дайджест Aravana — ключевые события в AI, робототехнике и longevity.

Похожие материалы

Как начать пользоваться Vidu: AI-генератор видео из текста и фото

Полный гайд по Vidu -- китайскому AI-сервису для создания видео. Бесплатный тариф, три режима генерации: из текста, из фото и по референсу. Никакой установки -- работает в браузере.

·7 мин

Как начать пользоваться Cline: автономный AI-агент для кода прямо в VS Code

Полный гайд по Cline -- open-source AI-агенту для VS Code с 5 миллионами установок. Работает с любой моделью, редактирует файлы, выполняет команды в терминале, открывает браузер. Apache 2.0, bring-your-own-key.

·7 мин

Как начать пользоваться CodeRabbit: AI-ревью кода прямо в GitHub и GitLab

Гайд по CodeRabbit -- самому популярному AI-инструменту для автоматического ревью кода. 2 миллиона репозиториев, поддержка GitHub, GitLab, Azure DevOps и Bitbucket. Бесплатно для open-source проектов.

·7 мин