Microsoft научил веб-агента писать код вместо кликов: +79% к базе GPT-5.4

Microsoft Research выложил Webwright — терминальный веб-агент, который пишет Playwright-код вместо кликов и берёт 60,1% на бенчмарке Odysseys.

Aravana··1 мин

🔴 Microsoft научил веб-агента писать код вместо кликов: +79% к базе GPT-5.4

Все думали, что веб-агенты будут как пользователи — кликать кнопки, заполнять формы, листать страницы. Microsoft Research посмотрел на разработчиков, которые пишут Playwright-скрипты, и решил: пусть агент делает то же самое.

По данным MarkTechPost, Microsoft Research выложил Webwright — открытый агент, живущий в терминале. Вместо того чтобы предсказывать каждое действие в браузере, он пишет Playwright-код, запускает bash-команды и читает логи. Архитектура минимальна: три модуля, около 1000 строк кода, без сложной оркестрации. На бенчмарке Odysseys (длинные задачи с инструкциями в среднем по 272 слова) Webwright с моделью GPT-5.4 показал 60,1% против 33,5% у базовой модели — относительный прирост 79,4% и +35,1% к предыдущему рекорду индустрии. Код выложен на GitHub, работает с бэкендами OpenAI, Anthropic и OpenRouter, дружит с Claude Code.

Что это меняет. Для бизнеса, который автоматизирует операции — от закупок до мониторинга цен конкурентов — это перелом подхода. Раньше каждое изменение интерфейса ломало RPA-сценарий, и нужен был дорогой разработчик с долгой поддержкой. Теперь агент пишет одноразовый скрипт под задачу, разбирается с ошибками сам, оставляет код в логах — и в следующий раз справляется быстрее. Будущее не за кликающими ботами, а за агентами, которые программируют сами себя.

Этот материал подготовлен командой AI-агентов AravanaAI и проверен главным редактором.

#нейросети #LLM #модели #агентыИИ #Microsoft #BigTech #ИИ #технологии #AravanaAI

Тип материала: Пост из Telegram

Поделиться:TelegramXLinkedIn
Как вам материал?

Хотите получать подобные материалы раньше?

Aravana Intelligence — авторская аналитика и закрытый круг для тех, кто думает на шаг вперёд.

Узнать про Intelligence

Не пропускайте важное

Еженедельный дайджест Aravana — ключевые события в AI, робототехнике и longevity.

Похожие материалы

Baidu предложила новую единицу измерения AI: «ежедневно активные агенты» вместо пользователей

Baidu представила четыре новых AI-агента и предложила метрику DAA — ежедневно активных агентов — как новый KPI вместо DAU. Робин Ли прогнозирует более 10 миллиардов агентов в мире.

·1 мин