Как установить LM Studio: AI с графическим интерфейсом на вашем компьютере

LM Studio — десктопное приложение для запуска AI-моделей локально с удобным графическим интерфейсом. Не нужен терминал — всё через GUI.

Aravana··1 мин

Обновления LM Studio (2026)

LM Studio v0.4.16 (8 июня 2026) добавил LM Link - функцию удалённых подключений с end-to-end шифрованием. Запустите LM Studio на мощном домашнем ПК и подключайтесь к нему с ноутбука или телефона через зашифрованный туннель без VPN настройки. Идеально для работы вне дома с локально запущенными моделями.

LM Studio v0.4.15 (4 июня 2026) -- CUDA Tensor Parallelism: Ключевое обновление для пользователей с несколькими видеокартами NVIDIA. CUDA Tensor Parallelism позволяет запускать одну модель сразу на нескольких GPU одновременно (например, две RTX 4090 для работы с 70B-моделями в full precision). Это открывает возможность запуска крупных моделей на потребительских мульти-GPU системах без перехода на профессиональное оборудование. Настройка: в параметрах модели появился ползунок GPU Split.

LM Studio поглотил Locally (приложение Apple Silicon, ранее известное как Locally AI): все функции Locally AI теперь в LM Studio. Оптимизированный MLX backend для Mac M-серии обеспечивает максимальную производительность на Apple Silicon - лучший выбор для Mac пользователей.

MCP (Model Context Protocol) как стандартная функция LM Studio: Начиная с v0.4.x, MCP поддерживается как стандартная функция -- не экспериментальная. Локальные модели через LM Studio теперь могут подключаться к MCP-серверам, в том числе с OAuth авторизацией (например, к Google Drive или GitHub). Это позволяет давать локальной модели контекст из ваших файлов и репозиториев без отправки данных в облако.

LM Studio Developer Mode: полный доступ к параметрам inference (temperature, top-p, repetition penalty, mirostat), настройка системного промпта для каждой модели, OpenAI-совместимый API сервер, batch обработка. Поддержка GGUF, MLX, ONNX форматов. Интеграция с LM Studio в VS Code через расширение.

Что такое LM Studio

LM Studio - десктопное приложение для запуска AI-моделей на вашем компьютере. Если Ollama работает через терминал, то LM Studio - это полноценное графическое приложение с интерфейсом в стиле ChatGPT. Скачали, выбрали модель, начали общаться - всё визуально и понятно.

LM Studio идеален для тех, кто хочет локальный AI, но не хочет работать с командной строкой.

Бесплатно или платно?

LM Studio полностью бесплатен для личного использования.

Доступ из России

LM Studio работает локально. VPN не нужен.

Как установить

Шаг 1. Откройте lmstudio.ai.

Шаг 2. Скачайте для Mac, Windows или Linux.

Шаг 3. Установите как обычное приложение.

Шаг 4. Откройте LM Studio -> перейдите в Discover (поиск моделей).

Шаг 5. Найдите модель (например, Llama 4 Scout, Qwen3 или Gemma 4) и нажмите Download.

Шаг 6. После скачивания перейдите в Chat, выберите модель и начните общение.

Рекомендуемые модели в 2026

Llama 4 Scout (17B) - флагман Meta с контекстом 10 млн токенов, отличный выбор для большинства задач.

Qwen3 (8B-30B) - сильная в коде и анализе, несколько размеров на выбор.

Gemma 4 (9B-31B) - лёгкая модель Google с открытой лицензией Apache 2.0.

Mistral 7B -- компактная и быстрая модель для чата.

Phi-4 -- маленькая модель Microsoft с сильной логикой.

Что нового в LM Studio (2026)

LM Studio 0.4.0 ввёл параллельные запросы с непрерывной обработкой (continuous batching) для высокопроизводительного сервинга, не-GUI режим llmster для серверного развёртывания, обновлённый REST API и обновлённый интерфейс.

Февраль 2026: добавлена функция LM Link -- подключение к удалённым экземплярам LM Studio с сквозным шифрованием (в партнёрстве с Tailscale). Теперь можно запустить LM Studio на мощном домашнем ПК и подключаться к нему с ноутбука.

Апрель 2026: добавлена поддержка NVIDIA DGX Station GB300 (Blackwell) -- теперь LM Studio работает на профессиональном оборудовании вне датацентров. Команда Adrien и приложений Locally AI влилась в команду LM Studio.

Чем отличается от Ollama

GUI vs CLI: LM Studio - визуальный, Ollama - терминальный.

Поиск моделей: LM Studio имеет встроенный каталог с поиском и фильтрами.

Настройки: LM Studio позволяет визуально настраивать параметры (температура, контекст и т.д.).

API: Оба предоставляют локальный API, совместимый с форматом OpenAI.

5 советов

1. Начните с рекомендованных моделей. LM Studio помечает модели, которые подходят для вашего железа.

2. Следите за размером. Модели от 3 до 70+ ГБ. Начните с маленьких (3-7 ГБ).

3. Настройте системный промпт. В настройках чата можно задать роль и поведение модели.

4. Используйте локальный API. LM Studio запускает OpenAI-совместимый сервер - подключите к любому приложению.

5. Для разработчиков. LM Studio + локальный API = тестирование AI-приложений без оплаты за облачный API.

LM Studio стал бесплатным для коммерческого использования (2026)

В 2026 году LM Studio изменил условия лицензии: бесплатный план теперь распространяется на коммерческое использование. Раньше бесплатная версия была только для некоммерческих проектов. Это делает LM Studio привлекательным для малого бизнеса и разработчиков, которые хотят интегрировать локальные AI-модели в свои продукты без затрат на лицензию. Рекомендуемые модели 2026: Llama 4 Scout, Qwen3.6-27B, Gemma 4.

LM Link (25 февраля 2026) - функция удалённого подключения к LM Studio. Теперь можно запустить LM Studio на мощном домашнем компьютере и использовать его с ноутбука или планшета по сети. Соединение зашифровано по E2E-протоколу - данные не проходят через серверы LM Studio. Это открывает сценарий 'домашний AI-сервер'.

llmster - новый официальный менеджер моделей для LM Studio с улучшенным интерфейсом. llmster показывает детальную информацию о каждой модели: бенчмарки, требования к памяти, рекомендуемые сценарии использования. Загрузка моделей теперь возможна в фоновом режиме без блокировки интерфейса.

LM Studio SDK 1.0.0 вышел с официальной поддержкой Python и TypeScript. SDK предоставляет OpenAI-совместимый API, что позволяет переключаться между локальными моделями и облачными сервисами, изменяя только endpoint. Для разработчиков это означает возможность тестировать приложения локально перед деплоем в продакшн.

LM Studio 0.4.12 -- обновления 2026

17 апреля 2026 года вышел LM Studio 0.4.12. Ключевые изменения с версии 0.4.0: добавлена поддержка Qwen 3.6 (новое поколение модели от Alibaba), исправлены проблемы с MCP OAuth на Windows. LM Studio продолжает оставаться наиболее удобным GUI-инструментом для запуска моделей локально -- особенно для пользователей без опыта в командной строке.

Практические примеры в LM Studio

После установки и загрузки модели: откройте Chat -- выберите загруженную модель из выпадающего списка. Для Qwen3: параметр temperature 0.7 даёт хорошие результаты для большинства задач. Для Llama 4 Scout рекомендуется context window 8192+ токенов. В разделе API Server вы можете запустить локальный API-сервер, совместимый с форматом OpenAI -- это позволяет подключить LM Studio к любому инструменту, поддерживающему OpenAI API.

Выбор модели в LM Studio

Рекомендации для мая 2026 по соотношению качество/скорость: Qwen3-8B для задач общего характера на GPU 8GB+. Llama 4 Scout (109B) для сложных аналитических задач при наличии 32GB+ VRAM. Gemma 4 для мультимодальных задач (текст + изображения). Phi-4 от Microsoft для задач с кодом при ограниченных ресурсах.

LM Studio v0.4.13 (13 мая 2026)

Вышла версия LM Studio v0.4.13. Ключевые изменения:

  • Vision модели стали на 20% точнее -- улучшено распознавание текста на изображениях (особенно таблицы, схемы, код на скриншотах). Обновление автоматическое для уже скачанных vision-моделей.
  • Рекомендуемая модель 2026 -- Qwen3.6-27B. Отличный баланс качества и скорости для большинства задач, особенно для кода и мультиязычных запросов. Скачайте через Browse -> Search: 'qwen3.6-27b'.
  • Оптимизация памяти для Apple Silicon -- модели от 7B до 14B теперь загружаются быстрее благодаря улучшенному управлению памятью через Metal API.

Обновите LM Studio через меню Help -> Check for Updates или скачайте последнюю версию на lmstudio.ai.

LM Studio v0.4.16 (8 июня 2026)

Вышла версия LM Studio v0.4.16 (8 июня 2026) -- стабильный выпуск MTP Speculative Decoding. Ключевые изменения:

  • MTP Speculative Decoding (stable) -- ускорение генерации для моделей со встроенными MTP-головами (multi-token prediction). Особенно эффективно с Gemma 4 -- заметное ускорение ответов.
  • Исправлен баг lms get gemma4 -- команда теперь корректно находит модели Gemma 4.
  • LM Link: отображение устройства -- при подключении через LM Link видно, на каком устройстве работает каждая удалённая модель.

Обновите LM Studio через меню Help -> Check for Updates или скачайте на lmstudio.ai.

Обновления LM Studio (2026)

LM Studio v0.4.x принёс значительные улучшения для работы с vision-моделями: качество анализа изображений выросло, скорость обработки увеличилась.

Среди рекомендуемых моделей для локального запуска: Qwen3 (серия от Alibaba) показывает высокую эффективность на потребительском железе. Полный список рекомендаций в интерфейсе LM Studio при поиске модели.

Поиск и загрузка модели

В LM Studio перейдите на вкладку «Discover» (иконка поиска). Используйте фильтры: Architecture (GGUF для CPU, MLX для Apple Silicon), Size (7B для слабых машин, 27B+ для мощных), Task (Code, Chat, Instruct). Рекомендуемые модели 2026:

  • Qwen3.6-7B-Instruct-GGUF -- лучший выбор для 8GB RAM, универсальный
  • Qwen3.6-27B-Instruct-GGUF -- для 16GB+ RAM, качество сопоставимо с GPT-4
  • Qwen3.6-Coder-7B-GGUF -- специализированная coding-модель
  • Gemma4-7B-Instruct-GGUF -- быстрая модель от Google

Нажмите Download рядом с выбранной моделью. LM Studio скачает GGUF-файл (3-20 GB в зависимости от размера). Прогресс отображается в нижней панели.

Локальный API сервер

LM Studio может работать как OpenAI-совместимый API сервер. Перейдите на вкладку «Local Server» (иконка сервера). Нажмите Start Server. Сервер запустится на http://localhost:1234.

Пример запроса через curl:

curl http://localhost:1234/v1/chat/completions -H "Content-Type: application/json" -d '{"model": "qwen3.6-7b", "messages": [{"role": "user", "content": "Привет!"}]}'

Пример из Python: используйте библиотеку openai с base_url="http://localhost:1234/v1" и api_key="lm-studio". Любое приложение, поддерживающее OpenAI API (Cursor, Continue, Obsidian AI) может работать с вашими локальными моделями.

Настройка параметров генерации

  • Temperature (0.0 - 1.0) -- 0.0: детерминированный, всегда одинаковый ответ (хорошо для кода), 0.7: баланс креативности и точности (универсально), 1.0: максимальная случайность (хорошо для творческих задач)
  • Context Length -- максимальная длина разговора в токенах. Больше контекст -- больше RAM. Начните с 4096, увеличивайте если нужно.
  • Top-P (0.0 - 1.0) -- контролирует разнообразие ответов. 0.9 -- хорошее значение по умолчанию.
  • Repeat Penalty (1.0 - 1.5) -- штраф за повторения. 1.1-1.2 помогает избежать зацикленности.

Оптимизация производительности

  • GPU Offload: в настройках модели укажите количество слоёв для GPU. Начните с 20, увеличивайте пока не получите ошибку out of memory. Больше слоёв на GPU -- быстрее генерация.
  • Batch Size: увеличьте для параллельных запросов (512-1024), уменьшите для экономии RAM.
  • Flash Attention: включите в Advanced Settings -- ускоряет обработку длинного контекста.

LM Studio vs Ollama: сравнение

  • LM Studio -- лучше для: разработчиков кому нужен мощный API сервер с мониторингом, пользователей предпочитающих GUI с детальными настройками параметров, тех кто работает с vision-моделями.
  • Ollama -- лучше для: быстрого старта (одна команда в терминале), интеграции с другими приложениями (OpenWebUI, Cursor, Continue), пользователей MacOS где Ollama лучше оптимизирован для Apple Silicon.

Оба инструмента бесплатны и поддерживают GGUF-модели. Многие разработчики устанавливают оба и используют их в зависимости от задачи.

LM Studio v0.4.15 -- обновления мая 2026

v0.4.13 (MLX engine v1.8.1): добавлены параллельные предсказания для vision-моделей на Apple Silicon. Модели Qwen 3.5/3.6 и Gemma 4 с поддержкой изображений теперь работают до 40% быстрее на M-чипах благодаря параллельной обработке входных данных.

v0.4.15 (4 июня 2026):

  • CUDA Tensor Parallelism -- поддержка мультиГПУ через CUDA tensor parallelism. Теперь можно распределить большую модель между несколькими видеокартами NVIDIA (например, две RTX 4090 для запуска 70B-моделей в full precision).
  • Исправление REST API HTTP/2 -- устранена ошибка, из-за которой некоторые HTTP/2 клиенты получали неверные ответы от встроенного LM Studio сервера.

Обновление LM Studio: откройте приложение -- значок профиля -- Check for Updates. Либо скачайте актуальный установщик с lmstudio.ai.

LM Studio v0.4.16 -- обновления июня 2026

Вышла версия LM Studio v0.4.16 (8 июня 2026). Ключевые изменения:

  • Locally -- мобильное приложение для iPhone и iPad -- LM Studio выпустила нативное iOS-приложение Locally с поддержкой LM Link (Tailscale). Теперь можно подключиться к своему LM Studio на Mac или ПК прямо со смартфона через зашифрованное соединение. Установите Locally из App Store, включите LM Link в LM Studio и подключайтесь удалённо.
  • LM Link без листа ожидания (Build 2) -- в v0.4.16 Build 2 удалён лист ожидания для LM Link: функция удалённого подключения теперь доступна всем пользователям без ожидания.

Обновите LM Studio через меню Help -- Check for Updates или скачайте актуальный установщик с lmstudio.ai.

Обновления LM Studio (июнь 2026): Текущая версия: v0.4.16 (выпущена 8 июня 2026 года). Обновление mlx-engine до v1.8.5: добавлено кэширование KV с сохранением контрольных точек для агентных задач с длинным контекстом. Теперь состояние рассуждения можно сохранить и продолжить в новой сессии.

Мобильное приложение Locally для iPhone и iPad

В июне 2026 года LM Studio выпустила Locally -- нативное мобильное приложение для iPhone и iPad. Locally позволяет получить доступ к моделям, запущенным в LM Studio на вашем Mac или ПК, прямо со смартфона или планшета.

Как это работает: LM Studio на компьютере создаёт защищённый туннель через технологию LM Link (основана на Tailscale). Locally на телефоне подключается к этому туннелю без необходимости настройки VPN или проброса портов. Все данные передаются в зашифрованном виде и не проходят через серверы LM Studio.

Установка: скачайте Locally из App Store, затем в LM Studio на компьютере перейдите в Settings -- LM Link и включите функцию. Приложение покажет QR-код для быстрого сопряжения с Locally на телефоне. После сопряжения мобильный доступ к вашим локальным моделям работает в любой точке мира, пока компьютер включён.

Начиная с LM Studio v0.4.16 Build 2, лист ожидания для LM Link удалён: функция доступна всем пользователям без ожидания.

LM Studio v0.4.15: CUDA Tensor Parallelism и Physical Batch Size

Версия v0.4.15 (4 июня 2026) принесла два важных нововведения для пользователей с несколькими видеокартами NVIDIA.

CUDA Tensor Parallelism позволяет распределить загрузку модели между несколькими GPU. Например, две карты RTX 4090 (48 ГБ суммарного VRAM) теперь можно использовать для запуска 70B-модели в full precision. Настройка: в параметрах модели появился ползунок GPU Split для распределения слоёв между устройствами.

Physical Batch Size -- новая опция в Advanced Settings. Она определяет, сколько токенов обрабатывается одновременно на физическом уровне GPU. Увеличение Physical Batch Size ускоряет обработку параллельных запросов при наличии свободного VRAM; уменьшение помогает при ошибках out of memory. Рекомендуемое начальное значение: 512 для большинства GPU.

Обновление API: system messages в /v1/messages

Начиная с версии v0.4.15, встроенный API-сервер LM Studio поддерживает системные сообщения внутри массива messages в эндпоинте /v1/messages. Раньше системный промпт передавался только через отдельный параметр system; теперь его можно включать прямо в массив сообщений в формате Anthropic Messages API:

POST http://localhost:1234/v1/messages
{
  "model": "qwen3.6-7b",
  "max_tokens": 1024,
  "messages": [
    {"role": "user", "content": "Привет!"},
    {"role": "assistant", "content": "Добрый день!"},
    {"role": "user", "content": "Расскажи о себе."}
  ],
  "system": "Ты помощник по Python-разработке."
}

Это упрощает миграцию кода, написанного под Anthropic API: менять только базовый URL и API-ключ, логика промптов остаётся прежней.

MTP Speculative Decoding: стабильный релиз (май 2026)

MTP Speculative Decoding -- технология ускорения генерации, которая использует встроенные в модель дополнительные prediction головы (Multi-Token Prediction) для того, чтобы предсказывать несколько следующих токенов одновременно.

Стабильный релиз MTP Speculative Decoding вышел 29 мая 2026 года. До этого функция была экспериментальной. Особенно хорошо работает с моделями Gemma 4 и DeepSeek V4, которые обучены с MTP-головами. Прирост скорости генерации на таких моделях составляет от 20 до 40%.

Включение в LM Studio: перейдите в Advanced Settings модели и активируйте MTP Speculative Decoding. LM Studio автоматически определит, поддерживает ли загруженная модель MTP; для моделей без MTP-голов опция будет неактивна.

MLX Engine v1.8.5: KV Cache с сохранением контрольных точек

Обновление MLX engine до версии v1.8.5 добавило KV Cache Checkpointing -- возможность сохранять состояние KV-кэша между сессиями. Это особенно важно для агентных задач с длинным контекстом.

Как это работает: при завершении сессии LM Studio сохраняет кэш ключей и значений внимания на диск. При следующем запуске с тем же документом или историей разговора модель не перечитывает весь контекст заново -- она загружает сохранённый кэш и продолжает с того места, где остановилась. Это значительно сокращает время холодного старта для задач с большим количеством предзагруженного контекста.

KV Cache Checkpointing доступно только на Apple Silicon (M-серия) через MLX engine. Для NVIDIA GPU аналогичная функциональность находится в разработке.

Ключевые изменения LM Studio v0.4.15 (4 июня 2026): Добавлен тензорный параллелизм (CUDA Tensor Parallelism) для многопроцессорных CUDA-систем -- несколько GPU теперь работают совместно для обслуживания одной модели. Режим генерации по умолчанию изменён на Streaming: ответы появляются по мере генерации без ожидания полного завершения. LM Link (удалённые подключения) доступен всем начиная с Build 2 v0.4.16 -- лист ожидания отменён.

LM Studio v0.4.17 Build 3 -- бета-версия (июнь 2026)

В июне 2026 года доступна бета-версия LM Studio v0.4.17 Build 3. Стабильная версия: v0.4.16 Build 2 (9 июня 2026) -- лист ожидания для LM Link отменён, функция удалённых подключений доступна всем пользователям. Бета v0.4.17 Build 3 включает экспериментальные улучшения производительности и поддержку новых форматов квантизации. Для установки стабильной версии: откройте Help -- Check for Updates или скачайте с lmstudio.ai. Бета-версию можно скачать с lmstudio.ai/beta -- не рекомендуется для production-использования.

Этот материал подготовлен командой AI-агентов AravanaAI и проверен главным редактором.

Тип материала: research

Поделиться:TelegramXLinkedIn
Как вам материал?

Читайте также

Хотите получать подобные материалы раньше?

Aravana Intelligence — авторская аналитика и закрытый круг для тех, кто думает на шаг вперёд.

Узнать про Intelligence

Не пропускайте важное

Еженедельный дайджест Aravana — ключевые события в AI, робототехнике и longevity.

Похожие материалы

Как начать пользоваться Vidu: AI-генератор видео из текста и фото

Полный гайд по Vidu -- китайскому AI-сервису для создания видео. Бесплатный тариф, три режима генерации: из текста, из фото и по референсу. Никакой установки -- работает в браузере.

·7 мин

Как начать пользоваться Cline: автономный AI-агент для кода прямо в VS Code

Полный гайд по Cline -- open-source AI-агенту для VS Code с 5 миллионами установок. Работает с любой моделью, редактирует файлы, выполняет команды в терминале, открывает браузер. Apache 2.0, bring-your-own-key.

·7 мин

Как начать пользоваться CodeRabbit: AI-ревью кода прямо в GitHub и GitLab

Гайд по CodeRabbit -- самому популярному AI-инструменту для автоматического ревью кода. 2 миллиона репозиториев, поддержка GitHub, GitLab, Azure DevOps и Bitbucket. Бесплатно для open-source проектов.

·7 мин