Все Insights

Devin 2.0 и поглощение Windsurf: как AI-кодеры меняют индустрию разработки

Cognition выпустила Devin 2.0 — автономного AI-инженера нового поколения, а затем приобрела Windsurf (бывший Codeium). Дайджест ключевых событий в мире AI-кодинга

Aravana··5 мин

Тип материала: Анализ

Поделиться:TelegramXLinkedIn

Ключевые выводы

  • Devin 2.0 от Cognition показал 53.7% на SWE-bench Verified (до оптимизаций Opus 4.5) и получил возможность работать в реальных командах: pull requests, code review, CI/CD интеграция.
  • Приобретение Windsurf (бывший Codeium) дало Cognition доступ к 200 000+ разработчиков и IDE-плагинам, создавая вертикальный стек от автокомплита до автономной разработки.
  • Рынок AI-кодинга разделился на два лагеря: copilots (помощники программиста) и autonomous agents (самостоятельные разработчики), и Cognition делает ставку на второй.

2025 год стал годом AI-кодеров — и две компании оказались в эпицентре событий чаще других. Cognition, создатель Devin — первого «AI-инженера», — выпустила вторую версию своего продукта и совершила громкое поглощение. Windsurf, ранее известный как Codeium, стал одной из самых интересных историй о трансформации стартапа. Давайте разберём оба события и посмотрим, что они означают для будущего разработки программного обеспечения.

Devin появился в марте 2024 года и вызвал бурю. Cognition Labs, стартап из 10 человек, показала демо, в котором AI-агент самостоятельно выполнял задачи из GitHub Issues: читал описание бага, исследовал кодовую базу, писал исправление, запускал тесты и создавал pull request. Это было радикально иначе, чем GitHub Copilot или ChatGPT: не подсказки при вводе кода, а полностью автономная работа. Скептики немедленно указали на ограничения: Devin справлялся только с простыми задачами, часто галлюцинировал, и его первый результат на SWE-bench (13.86%) был далёк от человеческого уровня. Но как proof of concept он изменил разговор об AI в разработке.

Devin 2.0, выпущенный в середине 2025 года, решил многие проблемы первой версии. Главное улучшение — надёжность. Если Devin 1.0 был блестящим, но непредсказуемым стажёром, Devin 2.0 — это junior-разработчик, которому можно доверить реальные задачи без постоянного контроля. На SWE-bench Verified модель набрала 53.7% — утроение результата по сравнению с первой версией и конкурентоспособный показатель на момент выхода (хотя Claude Opus 4.5 позже поднял планку до 72.2%). Но бенчмарки — это только часть истории.

Что действительно выделяет Devin 2.0 — это интеграция в реальные рабочие процессы. Cognition добавила поддержку Slack: вы можете написать Devin в корпоративном мессенджере, описать задачу, и он выполнит её. Появилась интеграция с Jira и Linear: Devin может автоматически брать задачи из бэклога и создавать pull requests. CI/CD интеграция позволяет Devin запускать тесты и проверять, что его изменения не сломали существующий код. Появился режим Code Review: вы добавляете Devin как reviewer на pull request, и он оставляет комментарии — не шаблонные замечания о стиле кода, а содержательные наблюдения о потенциальных багах, race conditions и edge cases.

Вторая большая новость — приобретение Windsurf. Бывший Codeium — стартап, который строил AI-автокомплит для кода и к 2025 году набрал более 200 000 активных пользователей. Сумма сделки не была раскрыта, но источники Bloomberg оценили её в $150-200 миллионов. Зачем Cognition, строящей автономного AI-кодера, понадобился сервис автокомплита? Ответ — в стратегии вертикальной интеграции.

Cognition увидела, что рынок AI-кодинга формирует спектр: на одном конце — базовый автокомплит (подсказки по одной строке), на другом — полностью автономная разработка (Devin). Между ними — IDE-ассистенты (Cursor, GitHub Copilot Chat), которые могут редактировать несколько файлов за раз, но требуют участия программиста. Cognition с Devin занимала только правый край спектра. Windsurf давал левый и средний. Объединённая компания может предложить полный стек: от подсказок при вводе кода до автономного решения задач из бэклога.

Стоит отметить более широкий контекст рынка AI-кодинга. К 2025 году он стал одним из самых динамичных сегментов AI-индустрии. GitHub Copilot — лидер по числу пользователей (более 1.8 миллиона платных подписчиков к концу 2025 года). Cursor — фаворит power users, интегрировавший агентные возможности прямо в IDE. Claude Code от Anthropic — CLI-инструмент, который работает из терминала и может модифицировать целые проекты. Amazon Q Developer — enterprise-решение с глубокой интеграцией в AWS. И десятки стартапов поменьше: Aider, Menlo, Poolside, Magic.

Рынок разделился на два философских лагеря. «Copilot camp» считает, что AI должен усиливать программиста: давать подсказки, генерировать boilerplate, объяснять код, ускорять рутину — но финальное решение всегда за человеком. «Agent camp» верит в автономных AI-разработчиков, которые берут задачу и выполняют её самостоятельно, а человек-программист превращается в менеджера, который формулирует задачи и проверяет результаты. Cognition — флагман agent camp. GitHub Copilot — столп copilot camp. Cursor, Claude Code и Windsurf — где-то посередине, предлагая оба режима работы.

Финансовые результаты говорят в пользу рынка в целом. Cognition подняла $175 миллионов в раунде Series A при оценке $2 миллиарда — одна из самых высоких оценок для AI-стартапа на такой ранней стадии. Cursor привлёк $400 миллионов при оценке $10 миллиардов. GitHub Copilot приносит Microsoft более $300 миллионов годовой выручки. Совокупный рынок AI-кодинга оценивается Goldman Sachs в $3.5 миллиарда в 2025 году с прогнозом роста до $15 миллиардов к 2028 году.

Однако остаются фундаментальные вопросы. Первый — качество. Даже лучшие AI-кодеры решают только половину задач из SWE-bench — бенчмарка, который сам по себе ограничен (в основном Python, стандартные библиотеки, хорошо задокументированные проекты). На реальных кодовых базах с legacy-кодом, нестандартными архитектурами и скудной документацией результаты значительно хуже. Второй — безопасность. Автономный агент, пишущий код и создающий pull requests, может внести уязвимости. Cognition добавила в Devin 2.0 автоматический security scan, но это решение, а не гарантия.

Третий вопрос — экономика. Devin 2.0 стоит $500/месяц за seat — дороже, чем junior-разработчик в некоторых регионах. При этом он решает задачи на уровне junior-разработчика (и хуже в сложных сценариях). Экономическое обоснование строится на двух аргументах: скорость (Devin работает 24/7 и не уходит на обед) и масштабируемость (можно запустить 10 экземпляров Devin на 10 задач одновременно). Для крупных компаний с большими бэклогами это может быть оправдано; для маленьких команд — пока дорого.

Поглощение Windsurf интересно ещё и как бизнес-кейс. Codeium построил product-led growth модель: бесплатный тарифный план привлекал разработчиков, платный ($15/мес) конвертировал 8-10% из них. К моменту приобретения у Codeium было около 15 000 платящих пользователей и $15-20 миллионов годовой выручки. Cognition получила не просто технологию, а канал дистрибуции: 200 000 разработчиков, уже использующих продукт, которым можно upsell'нуть Devin. Стратегия «троянского коня»: начни с бесплатного автокомплита, привлеки разработчиков, предложи им автономного агента.

Мы думаем, что через 2-3 года разделение на copilots и autonomous agents исчезнет. Каждый продукт для AI-кодинга будет предлагать спектр: от подсказок до автономной работы, с плавным переключением между режимами. Разработчик начнёт день с обзора pull requests, созданных Devin за ночь, потом переключится в режим copilot для работы над архитектурными решениями, потом делегирует несколько задач из бэклога обратно Devin. AI-кодер станет не заменой программиста, а его расширением — как IDE когда-то расширила текстовый редактор.

Как вы думаете, через сколько лет AI-кодеры смогут самостоятельно разрабатывать production-ready приложения среднего размера — без участия человека-программиста?

Хотите получать подобные материалы раньше?

Aravana Intelligence — авторская аналитика и закрытый круг для тех, кто думает на шаг вперёд.

Узнать про Intelligence

Похожие материалы

Программисты и AI: парадокс автоматизации своих создателей

AI пишет код всё лучше, а спрос на программистов падает. Профессия, создавшая AI, может стать одной из его главных жертв.

·4 мин·Выбор редакции

Microsoft объединяет AutoGen и Semantic Kernel: рождение агентной платформы нового поколения

Зачем Microsoft слила два своих главных AI-фреймворка в один — и что это значит для разработчиков агентных систем

·6 мин

Claude Opus 4.5: почему Anthropic назвала его лучшим агентом в мире

24 ноября 2025 года Anthropic выпустила Claude Opus 4.5 — модель, которая установила новые стандарты в агентных задачах и компьютерном использовании. Разбираемся, что изменилось

·5 мин