GPT Image 2 от OpenAI: полный гайд по генерации изображений

GPT Image 2 -- новая модель генерации изображений от OpenAI, доступная в ChatGPT с апреля 2026 года. Как создавать картинки, редактировать их и использовать текст внутри изображений.

2026-05-23·7 мин

Обновления GPT Image 2 (2026)

GPT Image 2 Thinking Mode (май 2026) - первая модель генерации изображений с встроенным reasoning. Перед генерацией модель 'размышляет' над промптом: анализирует неоднозначности, выбирает оптимальный стиль, планирует композицию. Видимый reasoning process позволяет понять и при необходимости скорректировать интерпретацию промпта.

Важное предупреждение для разработчиков: DALL-E 2 и DALL-E 3 были официально выведены из эксплуатации 12 мая 2026 года и полностью удалены из API OpenAI. Если ваше приложение использует endpoint images/generations с параметром model: "dall-e-3" или model: "dall-e-2" -- оно перестало работать. Необходима обязательная миграция на model: "gpt-image-2". Синтаксис запроса остался совместимым, поэтому замена занимает несколько минут. Подробный гайд по миграции: platform.openai.com/docs/guides/images.

4K поддержка: нативное разрешение 4096x4096 (квадрат) или 4096x2304 (16:9) согласно документации OpenAI -- фактически доступное максимальное разрешение для конкретного тарифа уточняйте в официальной документации openai.com/docs. По качеству деталей на уровне Midjourney V8.1 --hd. DALL-E 2 и DALL-E 3 официально выведены из эксплуатации 12 мая 2026 года и удалены из API OpenAI -- миграция на gpt-image-2 обязательна.

Editing API: в отличие от предшественников, GPT Image 2 имеет полноценный editing endpoint с маскировкой (inpainting) и outpainting. Принимает base64 изображение + маску + текстовый промпт. Интегрировано в ChatGPT интерфейс для редактирования загруженных изображений.

Ценообразование GPT Image 2 использует токенизированную модель: стоимость зависит от входных и выходных токенов изображения. Ориентировочная стоимость на момент написания -- от низкого до высокого качества для 1024x1024 -- варьируется существенно. Актуальные тарифы смотрите на openai.com/api/pricing. В ChatGPT Plus и Pro изображения включены в подписку с ежемесячным лимитом.

Доступ к GPT Image 2

Обновления GPT Image 2 (2026)

GPT Image 2 (официальное название модели: gpt-image-2) -- генератор изображений нового поколения от OpenAI, выпущенный 21 апреля 2026 года. Это принципиально новый подход к генерации изображений: в отличие от DALL-E 3, которая была отдельной моделью, GPT Image 2 является частью мультимодальной архитектуры OpenAI и «думает» перед созданием изображения -- анализирует запрос, планирует структуру и только затем генерирует.

Для конечных пользователей модель доступна под названием ChatGPT Images 2.0 в интерфейсе ChatGPT, для разработчиков -- через OpenAI API под идентификатором gpt-image-2. Ключевые характеристики: поддержка разрешения 4K, точный рендеринг текста на 40+ языках, инструменты инпейнтинга и возможность генерации с референсными изображениями.

Доступ к GPT Image 2

GPT Image 2 доступен через несколько каналов в зависимости от ваших потребностей.

Через ChatGPT (самый простой способ): функция Images 2.0 доступна в ChatGPT Free, Plus и Pro. Войдите в аккаунт на chat.openai.com. В поле чата нажмите иконку изображения (рядом с полем ввода) или напишите в чате: «Сгенерируй изображение...» -- ChatGPT автоматически переключится в режим генерации. Пользователи Free имеют ограниченное количество генераций в день; Plus и Pro -- расширенные лимиты.

Через OpenAI API (для разработчиков): доступен с 22 апреля 2026 года. Endpoint: POST /v1/images/generations с параметром model: 'gpt-image-2'. API также поддерживает инпейнтинг (редактирование областей изображения) через endpoint /v1/images/edits.

Через Microsoft Azure AI Foundry: GPT Image 2 доступен для корпоративных клиентов Azure. Это вариант для организаций, которые уже работают в инфраструктуре Microsoft и нуждаются в соответствии корпоративным требованиям безопасности.

Требования: аккаунт OpenAI (бесплатная регистрация на platform.openai.com), для API -- платёжные данные и API-ключ.

Возможности GPT Image 2

GPT Image 2 превосходит DALL-E 3 по нескольким ключевым направлениям.

Агентное рассуждение (Reasoning). Перед генерацией модель «думает»: анализирует запрос, определяет стиль, планирует композицию. Это особенно заметно при сложных, многоэлементных запросах -- модель правильно расставляет объекты относительно друг друга, соблюдает перспективу и логику сцены.

Разрешение 4K. GPT Image 2 генерирует изображения в разрешении до 4096x4096 пикселей. Доступны кастомные размеры -- от квадрата до широкоформатного баннера. Это делает модель пригодной для полиграфии и крупноформатной печати. Уточнение по тарифам: максимальное разрешение 4096x4096 доступно на платных подписках (Plus, Pro, Team). На бесплатном плане ChatGPT разрешение ограничено -- актуальные лимиты смотрите на openai.com/pricing.

Мультиязычный текст. Точный рендеринг текста на 40+ языках, включая японский, корейский, китайский, арабский, хинди, бенгальский. Кириллица также поддерживается. Это принципиальное улучшение по сравнению с DALL-E 3, который часто искажал нелатинские шрифты.

Инпейнтинг. Редактирование конкретных областей изображения: загрузите изображение, выделите область, опишите желаемое изменение -- модель переработает только выделенную зону, сохранив остальное.

Веб-поиск при генерации. Интеграция с реальным временем позволяет модели проверять актуальную информацию в процессе генерации -- особенно полезно для изображений, требующих фактической точности (логотипы компаний, известные здания, текущие события).

Работа с референсами. Загрузите до нескольких референсных изображений -- модель создаст новое изображение с заданными характеристиками стиля или содержания.

Как создать первое изображение

Пошаговая инструкция для создания первого изображения через ChatGPT Plus.

Шаг 1. Войдите в ChatGPT на chat.openai.com.

Шаг 2. Начните новый чат. В поле ввода напишите запрос на создание изображения. Например: «Создай профессиональный портрет бизнес-вумен 35 лет, студийное освещение, белый фон, деловой костюм, высокое разрешение».

Шаг 3. Нажмите Enter. GPT Image 2 начнёт процесс генерации -- сначала вы увидите краткий «план» (что модель собирается создать), затем само изображение.

Шаг 4. Оцените результат. Если что-то не устраивает, напишите уточнение прямо в чате: «Сделай фон светлее», «Добавь улыбку», «Измени цвет костюма на тёмно-синий». ChatGPT запомнит контекст и применит изменения к существующему изображению.

Шаг 5. Сохраните изображение. Нажмите на иконку загрузки под изображением. По умолчанию сохраняется в PNG. Разрешение зависит от тарифного плана.

Промпты для GPT Image 2

GPT Image 2 понимает детальные текстовые описания. Чем точнее промпт, тем ближе результат к задуманному.

Портрет: «Professional headshot of a 40-year-old man with short dark hair, confident smile, light grey background, business casual attire, Rembrandt lighting, sharp focus on eyes, Canon 5D style»

Пейзаж: «An aerial view of a dense forest in autumn with red and golden foliage, morning fog in the valleys, dramatic lighting from the side, 4K ultra detail, National Geographic style photo»

Продуктовое фото: «A luxury perfume bottle on black marble, soft side lighting, product photography, minimalist composition, reflections on surface, 4K resolution, commercial quality»

Иконка/логотип: «A simple flat icon of a rocket launching, dark blue and orange color palette, minimal design, white background, SVG-style, suitable for app icon»

Совет по промптам: GPT Image 2 хорошо понимает описания в стиле профессиональных фотографов («Rembrandt lighting», «bokeh background», «rule of thirds»). Используйте эти термины для получения более профессиональных результатов. Также эффективно указывать конкретный «стиль камеры» (Canon 5D, Hasselblad) или стиль освещения (studio, golden hour, overcast).

API доступ

Разработчики могут интегрировать GPT Image 2 в свои приложения через OpenAI API.

Базовый пример генерации (Python):

from openai import OpenAI
client = OpenAI()

response = client.images.generate(
    model="gpt-image-2",
    prompt="A serene mountain landscape at dawn",
    size="1024x1024",
    quality="high",
    n=1
)
print(response.data[0].url)

Параметры API: size (от 256x256 до 4096x4096), quality (standard/high/hd), n (количество вариантов, 1-4). Для инпейнтинга используйте endpoint /v1/images/edits с параметрами image (исходное изображение), mask (маска области), prompt (описание изменения).

Стоимость API на момент написания зависит от размера и качества изображения -- актуальные тарифы смотрите на openai.com/api/pricing. Входные изображения для инпейнтинга тарифицируются отдельно (за токены обработки).

GPT Image 2 vs DALL-E 3: сравнение

Понимание ключевых различий поможет выбрать правильный инструмент для задачи.

12 мая 2026 года OpenAI вывел из эксплуатации DALL-E 2 и DALL-E 3 через API. GPT Image 2 является их официальным преемником и доступен через те же каналы (ChatGPT и API).

Качество изображений: GPT Image 2 значительно превосходит DALL-E 3 -- особенно в сложных сценах, точности текста и фотореализме. DALL-E 3 часто искажал мелкие детали и текст на изображениях.

Понимание промптов: GPT Image 2 понимает более абстрактные и сложные описания благодаря агентному рассуждению. DALL-E 3 требовал более буквальных и конкретных промптов.

Разрешение: GPT Image 2 поддерживает 4K, DALL-E 3 был ограничен 1024x1024.

Скорость: GPT Image 2 может работать немного медленнее за счёт дополнительного этапа рассуждения -- это заметно при генерации сложных сцен (3-10 секунд дольше).

Стоимость: GPT Image 2 через API стоит дороже DALL-E 3, но обеспечивает существенно лучшее качество. Через ChatGPT (Plus/Pro) дополнительной оплаты за переход на Images 2.0 нет.

Доступ из России

OpenAI официально ограничивает доступ из России. Тем не менее, использование возможно с рядом условий.

VPN обязателен: для регистрации и использования ChatGPT и OpenAI API из России нужен VPN с сервером за пределами России. Рекомендуемые провайдеры: Mullvad, ProtonVPN, Outline. Подключайтесь к европейским или американским серверам.

Оплата: OpenAI принимает международные карты Visa и Mastercard. Карты российских банков не принимаются. Альтернативы: виртуальные карты иностранных банков (Wise, Revolut), оплата через доверенное лицо в другой стране.

API-ключи: после регистрации и пополнения баланса API-ключи работают без ограничений по географии подключения (при использовании VPN).

Альтернативы без VPN: некоторые API-платформы (fal.ai, Replicate) предоставляют доступ к аналогичным моделям без ограничений по региону -- проверьте их актуальную политику.

Изменение биллинга контейнерных сессий (июнь 2026)

2 июня 2026 года OpenAI изменил систему оплаты контейнерных сессий для GPT Image 2 API. Ранее при использовании контейнерных сессий выставлялся счёт за полную 20-минутную сессию, даже если генерация занимала меньше времени. Теперь биллинг идёт поминутно с минимальным порогом 5 минут. Это снижает стоимость коротких генераций -- разработчикам, использующим API с контейнерными сессиями, рекомендуется обновить расчёты стоимости. Актуальные тарифы уточняйте на openai.com/api/pricing.

Thinking Mode: как активировать и что меняется

Thinking Mode -- режим рассуждения GPT Image 2 перед генерацией. Модель «думает» о запросе: анализирует сцену, планирует композицию, определяет освещение и стиль. Это занимает дополнительное время (10-30 секунд), но повышает точность для сложных запросов.

Как активировать Thinking Mode в ChatGPT:

Откройте ChatGPT (Plus, Pro или Team).
Нажмите на иконку модели в верхней строке -- выберите GPT Image 2 (с рассуждением) или включите переключатель Extended thinking перед отправкой запроса на изображение.
Напишите ваш запрос. Перед генерацией ChatGPT покажет краткий «план» -- что модель собирается создать.
Дождитесь результата. При сложных запросах Thinking Mode заметно улучшает точность деталей.

Через API: передайте параметр "reasoning": {"effort": "high"} в запросе к endpoint /v1/images/generations. Это активирует режим рассуждения для программных запросов.

Что меняется с Thinking Mode: без него модель сразу генерирует по промпту -- быстро, но иногда неточно для сложных сцен. С Thinking Mode: количество персонажей соответствует запросу, текст на изображении рендерится правильнее, пространственные отношения (объект слева/справа/за/перед) соблюдаются точнее. Для простых промптов разница минимальна.

Полный редактирующий воркфлоу через API

GPT Image 2 поддерживает inpainting (замена части изображения) и outpainting (расширение за края) через API.

Inpainting (замена области):

import base64
from openai import OpenAI
client = OpenAI()

# Загрузите изображение и маску
with open("image.png", "rb") as f:
    image_data = base64.b64encode(f.read()).decode()
with open("mask.png", "rb") as f:
    mask_data = base64.b64encode(f.read()).decode()

# Маска: белый = заменить, чёрный = сохранить
response = client.images.edit(
    model="gpt-image-2",
    image=open("image.png", "rb"),
    mask=open("mask.png", "rb"),
    prompt="A golden retriever sitting on the grass",
    n=1,
    size="1024x1024"
)

Outpainting (расширение изображения): создайте изображение большего размера с прозрачными краями как маской. Передайте оригинальное изображение (в центре холста) с маской прозрачных областей -- GPT Image 2 заполнит их контентом, органично продолжающим оригинал. Размер результата задаётся параметром size.

Практические промпты для разных задач

Маркетинговые изображения: A minimalist product shot of a glass water bottle on white marble, soft diffused lighting, premium lifestyle feel, no text, square format

Иллюстрации для статей: Isometric illustration of a modern home office with plants, warm lighting, flat design style, blue and beige color palette

Социальные сети (портрет): Professional LinkedIn headshot of a 35-year-old woman, natural smile, gray blazer, soft bokeh background, studio quality lighting

Текст на изображении (возможности Thinking Mode): A motivational poster with the text 'Build in public' in bold sans-serif font, dark navy background, white text, minimalist design -- используйте Thinking Mode для лучшего рендеринга текста.

Инфографика: Simple flat infographic showing 3 steps: Research, Build, Launch. Icons for each step, light blue and white color scheme, clean corporate style

Сравнение: GPT Image 2 vs Midjourney vs Ideogram 4.0

Критерий	GPT Image 2	Midjourney V8.1	Ideogram 4.0
Текст на изображении	Отлично (Thinking Mode)	Слабо	Отлично
Фотореализм	Отлично	Отлично	Хорошо
Сложные сцены	Отлично (reasoning)	Хорошо	Хорошо
Editing API (inpainting)	Да	Нет	Частично
Интеграция с ChatGPT	Нативная	Нет	Нет
4K разрешение	Да	Да (V8.1)	Нет
Модерация контента	Строгая	Умеренная	Умеренная
Интерфейс на русском	Да (ChatGPT)	Нет	Нет

Выбирайте GPT Image 2 для задач с точным текстом, сложными описаниями, редактирования через API и интеграции в продукты через OpenAI. Выбирайте Midjourney V8.1 для художественного качества и атмосферных изображений. Выбирайте Ideogram 4.0 для плакатов, обложек и типографики.

Уведомление о миграции с DALL-E 2 и DALL-E 3

12 мая 2026 года OpenAI вывел из эксплуатации DALL-E 2 и DALL-E 3 через API. Если ваш код использовал модели dall-e-2 или dall-e-3, замените на gpt-image-2. Параметры size и quality совместимы, но GPT Image 2 принимает расширенный диапазон размеров. Для редактирования теперь используйте endpoint /v1/images/edit с параметром model="gpt-image-2".

ВАЖНО для разработчиков -- дата устаревания 1 декабря 2026 года: OpenAI анонсировала прекращение поддержки алиасов gpt-image-1-mini, gpt-image-1.5 и chatgpt-image-latest с 1 декабря 2026 года. Замените их на явное указание gpt-image-2 заблаговременно. Актуальный endpoint gpt-image-2 продолжает работать без изменений. Следите за обновлениями в документации platform.openai.com/docs.

Важное уточнение по устаревшим моделям: 1 декабря 2026 года будут выведены из эксплуатации более старые модели - gpt-image-1-mini, gpt-image-1.5 и алиас chatgpt-image-latest. Сам gpt-image-2 является актуальной заменой и продолжит работать.

Если вы используете в коде алиас chatgpt-image-latest, замените его на явное указание gpt-image-2 до 1 декабря 2026 года. Это предотвратит ошибки после даты устаревания. Все новые проекты рекомендуется начинать с gpt-image-2 напрямую.

Этот материал подготовлен командой AI-агентов AravanaAI и проверен главным редактором.

Поделиться:Telegram X LinkedIn

Как вам материал?

Теги:AI Images OpenAI GPT Image 2 DALL-E генерация изображений

Хотите получать подобные материалы раньше?

Aravana Intelligence — авторская аналитика и закрытый круг для тех, кто думает на шаг вперёд.

Узнать про Intelligence

Не пропускайте важное

Еженедельный дайджест Aravana — ключевые события в AI, робототехнике и longevity.

Как начать пользоваться Agno: Python-фреймворк для создания AI-агентов

Agno (бывший phidata) - один из самых популярных Python-фреймворков для построения AI-агентов с 39k+ звезд на GitHub. Пошаговый гайд: установка, первый агент за 5 минут, мультиагентные команды и деплой в продакшн.

2026-07-14·8 мин

С чего начать·Гайд

Seedance 2.5: как начать пользоваться генератором видео от ByteDance

Seedance 2.5 от ByteDance генерирует нативное 30-секундное видео в один проход, принимает до 50 мультимодальных референсов и позволяет редактировать отдельные фрагменты без перегенерации всего клипа.

2026-07-13·7 мин

С чего начать·Гайд

ChatGPT Work: как начать пользоваться агентным рабочим столом OpenAI

9 июля 2026 OpenAI запустила ChatGPT Work -- агента, который берёт у вас целый проект, сам планирует шаги, работает часами в фоне и возвращает готовый документ, таблицу или презентацию.

2026-07-13·8 мин