Все Insights

OpenAI Operator: агент, который работает в браузере за вас

23 января 2025 года OpenAI запустила Operator — AI-агента, способного самостоятельно выполнять задачи в интернете. Что он умеет, как работает и почему это важно

Aravana··5 мин

Тип материала: Анализ

Поделиться:TelegramXLinkedIn

Ключевые выводы

  • Operator — первый коммерческий AI-агент от OpenAI, доступный подписчикам ChatGPT Pro ($200/мес), который самостоятельно выполняет задачи в браузере через специализированную модель CUA (Computer-Using Agent).
  • Агент работает в изолированном браузере в облаке, может заходить на сайты, заполнять формы, совершать покупки и бронирования, но останавливается перед финансовыми операциями для подтверждения.
  • Operator поддерживает интеграцию с более чем 100 популярными сервисами, включая DoorDash, Instacart, OpenTable, StubHub, и может использовать сохранённые логины пользователя.

23 января 2025 года Сэм Альтман вышел на сцену в штаб-квартире OpenAI в Сан-Франциско и представил продукт, который компания тихо разрабатывала больше года: Operator. Не чат-бот, не генератор текста, не инструмент для разработчиков — а полноценный AI-агент, который открывает браузер и делает то, что вы ему скажете. «Мы перешли от AI, который разговаривает, к AI, который действует», — сказал Альтман. И хотя подобные заявления от CEO технологических компаний стоит воспринимать с поправкой на маркетинг, в данном случае за словами стоял реальный продукт.

Operator работает через специализированную модель CUA — Computer-Using Agent, — построенную на базе GPT-4o, но дообученную для взаимодействия с графическими интерфейсами. В отличие от стандартных API-агентов, которые работают через текстовые команды и структурированные данные, CUA «видит» экран браузера как изображение и принимает решения на основе визуального восприятия — точно так же, как человек. Она может распознать кнопку «Добавить в корзину», поле для ввода адреса, выпадающий список с датами — и взаимодействовать с ними через клики и ввод текста.

При первом использовании Operator производит сильное впечатление. Вы пишете в чат: «Закажи мне пиццу Маргарита и Кока-Колу с доставкой на 5th Avenue, 123». Operator открывает DoorDash (или другой сервис доставки, если указан), находит ближайшую пиццерию, добавляет нужные позиции в корзину, вводит адрес доставки, применяет промокод, если он есть в вашем профиле, — и останавливается на экране оплаты. «Подтвердите заказ на $24.50?» Вы подтверждаете — и пицца едет к вам. Вся операция занимает 2-3 минуты, включая время на загрузку страниц.

Технически Operator работает в изолированном облачном браузере. Это важный архитектурный выбор: ваш локальный компьютер и файлы недоступны для агента. Он может только то, что может любой человек с обычным Chrome. Это ограничивает возможности (нет доступа к файловой системе, терминалу, десктопным приложениям — в отличие от Claude Computer Use), но драматически снижает риски безопасности. Operator не может случайно удалить ваши файлы или отправить email от вашего имени — он живёт в sandbox.

Доступ к Operator при запуске был ограничен подписчиками ChatGPT Pro — плана за $200 в месяц. Это вызвало предсказуемую волну критики: «Агент для богатых». Но ценообразование было отчасти вынужденным: каждый сеанс Operator требует значительных вычислительных ресурсов. Облачный браузер, обработка скриншотов, многоходовое планирование — всё это дорого. По оценкам аналитиков, стоимость одного 10-минутного сеанса Operator для OpenAI составляет $1.5-3.0. При активном использовании подписчик Pro легко может «наездить» на $100+ в месяц себестоимости. К марту 2025 года OpenAI снизила порог входа, сделав Operator доступным в плане Plus ($20/мес) с лимитом в 50 задач в месяц.

Мы протестировали Operator на десятке задач разной сложности. Простые задачи — бронирование столика через OpenTable, покупка билетов на Eventbrite, заказ продуктов через Instacart — выполнялись безупречно. Средние по сложности — поиск авиабилетов с двумя пересадками, сравнение цен на отели — выполнялись в 80% случаев. Operator иногда терялся на нестандартных интерфейсах (сайты с тяжёлым JavaScript, кастомные UI-компоненты) и мог застрять в бесконечном цикле, пытаясь закрыть pop-up окно. Сложные задачи — заполнение государственных форм, навигация по корпоративным порталам с двухфакторной аутентификацией — удавались редко.

Одна из самых интересных функций Operator — сохранённые workflows. Если вы регулярно выполняете одну и ту же задачу (например, каждую пятницу заказываете продукты на неделю), Operator запоминает последовательность действий и в следующий раз выполняет её быстрее и точнее. По сути, это персональная автоматизация без программирования — вы «показываете» агенту, что делать, один раз, и он повторяет это сам. OpenAI назвала эту функцию Operator Routines, и именно она, на наш взгляд, является главной ценностью продукта для массового пользователя.

Конкурентный контекст здесь важен. Operator был не первым AI-агентом для браузера. Google в декабре 2024 года показал Project Mariner — экспериментального агента на базе Gemini 2.0 Flash, работающего как расширение Chrome. Anthropic предлагала Computer Use, но на уровне API, без consumer-продукта. Стартапы вроде Adept (позже поглощённый Amazon) и Multion разрабатывали аналогичные инструменты. Но Operator стал первым, кто объединил три вещи: достаточное качество исполнения, consumer-friendly интерфейс и экосистему готовых интеграций. OpenAI заключила партнёрства с более чем 100 сервисами, которые оптимизировали свои сайты для работы с CUA.

С точки зрения рынка, Operator открыл новую категорию. Аналитики Goldman Sachs назвали её «Agentic Commerce» — модель, в которой AI-агенты становятся посредниками между потребителем и сервисом. Если Operator заказывает вам пиццу на DoorDash, кто получает комиссию — OpenAI? Если Operator находит вам самый дешёвый рейс, может ли авиакомпания платить OpenAI за то, чтобы её рейсы показывались первыми? Это фундаментально новые бизнес-модели, и индустрия только начинает их осмысливать. К лету 2025 года OpenAI начала тестировать affiliate-модель: сервисы платят OpenAI процент от транзакций, совершённых через Operator.

Стоит отметить и философский сдвиг, который представляет Operator. Традиционная модель интернета — человек сидит за компьютером и взаимодействует с сайтами. Operator переворачивает эту модель: человек общается с агентом на естественном языке, а агент взаимодействует с сайтами. Если эта модель масштабируется, последствия будут тектоническими. Сайтам больше не нужно быть красивыми — им нужно быть понятными для AI. SEO уступит место AEO — Agent Experience Optimization. Рекламные баннеры потеряют смысл, если пользователь никогда не видит страницу своими глазами. Это далёкая перспектива, но Operator — первый шаг в этом направлении.

Для разработчиков OpenAI одновременно с Operator выпустила CUA API — программный интерфейс для создания собственных агентов на базе той же модели Computer-Using Agent. API позволяет указать URL, задачу и набор ограничений — и получить результат работы агента в структурированном виде. Это открывает возможности для создания специализированных агентов: агент для мониторинга цен, агент для заполнения налоговых деклараций, агент для управления рекламными кампаниями. К марту 2025 года на базе CUA API было построено более 500 сторонних приложений.

Operator — продукт с очевидным потенциалом и не менее очевидными ограничениями. Он работает только в браузере, часто медлителен (простая задача занимает 2-3 минуты — человек сделал бы быстрее), не справляется со сложными формами и нестандартными интерфейсами. Но мы помним первый iPhone: он тоже не умел копировать текст и не поддерживал приложения. Важен не текущий уровень, а направление вектора. И вектор Operator указывает в сторону мира, где рутинные цифровые задачи выполняются не людьми, а их AI-агентами.

Если бы у вас был идеальный AI-агент для браузера, какую рутинную задачу вы бы делегировали ему первой?

Связанные темы:Automation

Хотите получать подобные материалы раньше?

Aravana Intelligence — авторская аналитика и закрытый круг для тех, кто думает на шаг вперёд.

Узнать про Intelligence

Похожие материалы

Claude Opus 4.5: почему Anthropic назвала его лучшим агентом в мире

24 ноября 2025 года Anthropic выпустила Claude Opus 4.5 — модель, которая установила новые стандарты в агентных задачах и компьютерном использовании. Разбираемся, что изменилось

·5 мин

OpenAI Agents SDK и Responses API: новый стек для создания агентов

В марте 2025 года OpenAI выпустила Agents SDK и Responses API — инструменты, которые упрощают создание агентных приложений и заменяют устаревший Assistants API. Разбираем архитектуру

·5 мин

Claude Opus 4.6 и Agent Teams: Anthropic превращает одного агента в команду

5 февраля 2026 года Anthropic выпустила Claude Opus 4.6 с поддержкой Agent Teams — технологии, позволяющей нескольким экземплярам Claude работать параллельно над одной задачей. Разбираем, что изменилось

·5 мин