Skild AI привлекает $1,4 млрд при оценке $14 млрд: универсальный мозг для роботов
Стартап Skild AI закрыл раунд на $1,4 млрд при оценке $14 млрд. Компания разрабатывает универсальную AI-модель для управления любыми роботами.
Тип материала: Анализ
14 января 2026 года питтсбургский стартап Skild AI объявил о закрытии раунда финансирования на 1,4 миллиарда долларов при оценке компании в 14 миллиардов. Это один из крупнейших раундов в истории робототехники и один из немногих случаев, когда компания с менее чем 100 сотрудниками и практически нулевой выручкой получает оценку, превышающую капитализацию многих публичных промышленных компаний. Раунд возглавили Lightspeed Venture Partners и SoftBank Vision Fund 2, с участием Amazon (через подразделение AWS Industrial Innovation), Coatue Management, Jeff Bezos Expeditions, нескольких суверенных фондов Ближнего Востока, включая Mubadala Investment Company из Абу-Даби и Saudi Aramco Ventures. Мы попробуем разобраться, что именно инвесторы увидели в Skild AI, что заставило их выписать чеки на такие суммы.
Skild AI основана двумя профессорами из Университета Карнеги-Меллона — одного из трёх-четырёх лучших в мире университетов в области робототехники и AI. Абхинав Гупта — эксперт в компьютерном зрении, самообучающихся системах и мультимодальном AI, автор более 200 научных работ, цитируемых суммарно более 50 000 раз. Дипак Патхак — специалист по обучению с подкреплением (reinforcement learning), любопытство-направленному обучению (curiosity-driven learning) и робототехническому AI, один из пионеров применения современных нейросетевых методов к управлению физическими роботами. Оба — рецензенты ведущих конференций NeurIPS, ICML, CVPR, оба консультировали Google, Meta и NVIDIA, прежде чем основать Skild. Их центральная идея звучит одновременно просто в формулировке и грандиозно в амбициях: создать foundation model для робототехники — единую, универсальную AI-модель, которая может управлять любым роботом, от шестиосного промышленного манипулятора до двуногого гуманоида, от квадрупода до дрона, без необходимости обучать отдельную, специализированную модель под каждый конкретный тип оборудования.
Аналогия, которую основатели используют в каждом публичном выступлении: GPT стал универсальной моделью для текста, DALL-E и Midjourney — для изображений, Sora — для видео, а Skild станет универсальной моделью для физического мира. Одна модель, обученная на колоссальном массиве данных о движении, взаимодействии с объектами, навигации в трёхмерном пространстве и физических свойствах материалов, которая затем адаптируется к конкретному роботу с его уникальной кинематикой за часы или дни тонкой настройки (fine-tuning), а не за месяцы или годы полного обучения с нуля. На слайдах и в презентациях это выглядит красиво, логично, неизбежно — как следующий естественный шаг после языковых и визуальных foundation models. Вопрос, как всегда и во всём в робототехнике, — в чудовищной сложности реализации, в том зазоре между элегантной идеей и работающим продуктом.
Мы подробно изучили всё, что Skild показала публично за полтора года существования: демонстрации на конференциях CoRL 2025 и NeurIPS 2025, техническую публикацию в arxiv (препринт, не прошедший полное рецензирование), видеоматериалы на сайте и в YouTube, интервью основателей для Bloomberg, TechCrunch и IEEE Spectrum. Компания демонстрировала свою модель на шести принципиально различных робототехнических платформах: двух гуманоидах (Unitree G1 и 1X NEO в ранней версии), промышленном манипуляторе Franka Emika Panda, четвероногом роботе (квадруподе Unitree Go2), гексакоптерном дроне и мобильной колёсной платформе Clearpath Robotics. Во всех шести случаях использовалась одна и та же базовая модель с минимальной платформо-специфичной донастройкой — Skild заявляет, что адаптация к новой робототехнической платформе требует от 2 до 8 часов вычислений на одном GPU кластере уровня A100 или H100, при условии наличия URDF-описания (стандартный формат описания кинематики робота). Роботы на демонстрациях выполняли набор задач: захват объектов различной формы и веса (от теннисного мяча до бутылки с водой), обход заранее не размеченных препятствий (стулья, коробки), реакция на неожиданные изменения (человек перемещал объект во время попытки захвата, и робот корректировал траекторию). Впечатляюще — но с существенными оговорками: лабораторные условия, ограниченный и заранее определённый список задач, контролируемое освещение и фон, отсутствие тонких манипуляций (работа с хрупкими объектами, точная сборка) и взаимодействия в тесном, загромождённом пространстве.
Техническая архитектура Skild — мультимодальная трансформерная модель с несколькими специализированными энкодерами для разных типов входных данных. Визуальный энкодер обрабатывает изображения с камер (RGB и depth), проприоцептивный энкодер принимает данные о состоянии суставов (позиция, скорость, усилие), тактильный энкодер обрабатывает сигналы от датчиков давления и текстуры (если они есть на конкретном роботе), языковой энкодер интерпретирует текстовые или голосовые инструкции. Все эти модальности объединяются в общее латентное представление, из которого декодер генерирует последовательность управляющих команд — целевые позиции суставов с временными метками. Модель обучена на трёх типах данных суммарным объёмом, по заявлению Skild, более 2 миллионов часов робототехнических взаимодействий. Первый источник — видео реальных робототехнических операций от академических лабораторий и промышленных партнёров (около 200 000 часов). Второй — синтетические данные из симуляций в средах Isaac Sim, MuJoCo и собственном симуляторе Skild (около 1,5 миллиона часов). Третий — видеозаписи людей, выполняющих бытовые и производственные задачи (около 300 000 часов YouTube-видео и приватных датасетов), которые модель использует для извлечения паттернов манипуляции без прямого робототехнического контроля. Доминирование синтетических данных (более 75 процентов обучающей выборки) — и наиболее инновационный, и наиболее рискованный аспект подхода: sim-to-real transfer (перенос навыков из симуляции в реальный мир) остаётся одной из центральных и до конца не решённых проблем робототехнического AI.
Оценка в 14 миллиардов долларов для компании без значительной выручки и с продуктом в стадии раннего тестирования требует объяснения, выходящего за рамки обычного венчурного оптимизма. Мы попытались реконструировать логику инвесторов. Если Skild создаст работающую универсальную модель и станет поставщиком «операционной системы» или «мозга» для робототехнической индустрии, потенциальный рынок колоссален. Goldman Sachs прогнозирует, что к 2035 году в мире будет работать от 10 до 50 миллионов роботов с AI-управлением (включая гуманоидных, промышленных, логистических и сервисных). При модели SaaS-подписки — скажем, 500 долларов в месяц за робота (6 000 долларов в год) — и парке в 20 миллионов роботов, это 120 миллиардов долларов ежегодной выручки. Даже при 5-процентной доле рынка — 6 миллиардов. При мультипликаторе 10x для SaaS-бизнеса — оценка в 60 миллиардов. С этой перспективы 14 миллиардов сегодня — агрессивно, но не безумно. Всё держится на двух критических допущениях: «если создаст» и «если рынок материализуется». Оба — серьёзные «если».
Конкурентная среда на рынке robot foundation models — возможно, самая интенсивная и высококонцентрированная в истории AI. NVIDIA разрабатывает GR00T N1, подкреплённый собственной аппаратной экосистемой (Jetson Thor) и инструментами для симуляции (Isaac Sim, Omniverse). Google DeepMind параллельно развивает линейку RT-моделей (RT-1, RT-2, RT-X, RT-H) с доступом к вычислительным ресурсам Google и десяткам роботов в собственных лабораториях. Physical Intelligence — стартап, основанный бывшими исследователями Google Brain, Stanford и Berkeley — привлёк 400 миллионов долларов на создание foundation model с фокусом на манипуляционные задачи и показал впечатляющие результаты с diffusion policy подходом. Toyota Research Institute публикует передовые работы по diffusion policy моделям и имеет бюджет в миллиард долларов на AI-робототехнику. Covariant (бывший сотрудник OpenAI Питер Чен) разрабатывает RFM-1 (Robot Foundation Model) специализированно для складских операций. MIT CSAIL, Stanford AI Lab, Berkeley BAIR, CMU Robotics Institute — десятки ведущих лабораторий ведут параллельные исследования с открытыми публикациями. Рынок robot foundation models находится в фазе «кембрийского взрыва», и определить победителя сегодня так же невозможно, как предсказать в 2015 году, что GPT от OpenAI станет доминирующей парадигмой в NLP.
Мы видим в подходе Skild как серьёзные сильные стороны, так и фундаментальные, системные риски. Главная сильная сторона — фокус на обобщении и кросс-платформенности: одна модель для разных роботов. Если это работает на практике (а не только в демонстрациях), это радикально меняет экономику внедрения AI в робототехнику. Сегодня компания, которая хочет добавить AI-навыки в своего робота, должна нанять команду из 30-50 ML-инженеров (годовой фонд оплаты — 5-10 миллионов долларов), потратить 12-18 месяцев на сбор данных, обучение модели и тестирование, и повторять этот процесс для каждого нового робота или существенного изменения задачи. Если Skild предлагает API, к которому можно подключить робота и получить базовые навыки манипуляции и навигации за часы — это снижение барьера входа на порядок. Это бизнес-модель в стиле AWS для физического мира.
Фундаментальный риск — в том, что задача создания универсальной модели для физического мира может оказаться качественно, а не количественно, сложнее, чем создание языковых или визуальных моделей. Текст — это последовательность токенов в дискретном пространстве с чёткими правилами грамматики и семантики. Изображение — это массив пикселей в двумерном пространстве. Физический мир — это бесконечно-мерное, непрерывное, стохастическое пространство, где каждый объект имеет массу, инерцию, центр тяжести, коэффициенты трения (статический и динамический, разные для разных пар поверхностей), упругость, хрупкость, деформируемость. Каждая поверхность имеет свои свойства, которые меняются от температуры, влажности, загрязнения, износа. Каждый робот имеет уникальную кинематику с люфтами в суставах, которые увеличиваются со временем, нелинейностями в двигателях, задержками в датчиках, деформацией корпуса под нагрузкой. Создать одну модель, которая надёжно обобщает всё это разнообразие и генерирует безопасные, точные, своевременные действия в реальном времени — задача, масштаб которой, вероятно, на порядки превышает создание GPT-4 или DALL-E 3. Мы не утверждаем, что это невозможно — история технологий полна примеров решения «невозможных» задач. Мы говорим, что оценка в 14 миллиардов подразумевает уровень уверенности в успехе, который, на наш взгляд, пока не подкреплён достаточным количеством публичных доказательств.
Использование привлечённых 1,4 миллиарда заслуживает отдельного анализа. По данным из пресс-релиза и интервью основателей, распределение примерно следующее: 60 процентов (около 840 миллионов) — на вычислительные ресурсы для обучения моделей, включая аренду и строительство GPU-кластеров (Skild использует чипы NVIDIA H100 и B200, и по масштабу вычислений конкурирует за ресурсы с крупнейшими AI-лабораториями); 20 процентов (280 миллионов) — на расширение и диверсификацию датасета: покупка данных от робототехнических компаний, построение собственных лабораторий для сбора реальных (не симулированных) данных, развитие партнёрств с производителями роботов; оставшиеся 20 процентов (280 миллионов) — на наём (Skild набирает PhD-специалистов по робототехнике и ML, предлагая зарплаты 300-500 тысяч долларов в год, конкурентные с Google, Meta и OpenAI), аренду офисов и лабораторий, юридические расходы и операционные нужды. При таком burn rate (скорости расходования капитала) — по нашим оценкам, 300-500 миллионов долларов в год — привлечённых средств хватит на 3-4 года интенсивной работы. Если к этому времени компания не покажет коммерчески жизнеспособный продукт — потребуется новый раунд на ещё более амбициозных условиях.
Для робототехнической индустрии в целом мега-раунд Skild AI несёт структурный, возможно эпохальный сигнал. Инвесторы самого высокого калибра — SoftBank, Amazon, суверенные фонды — своими деньгами голосуют за то, что «мозг робота» — это отдельный, самостоятельный и потенциально огромный рынок, а не неотделимая часть бизнеса по производству самих роботов. Если эта ставка верна, индустрия может разделиться по модели, знакомой нам по рынку персональных компьютеров и смартфонов: одни компании делают «тела» (hardware — рамы, актуаторы, сенсоры, батареи), другие делают «мозги» (foundation models, операционные системы, runtime-среды), третьи — интегрируют всё вместе и продают конечным клиентам с вертикальной специализацией. Qualcomm делает чипы, Google делает Android, Samsung собирает устройства, Uber создаёт сервис. В робототехнике: Unitree или Boston Dynamics производят роботов, Skild или NVIDIA поставляют AI-модели и платформы, системные интеграторы вроде Accenture или Siemens адаптируют решения для конкретных отраслей.
Мы относимся к Skild AI с осторожным, но искренним интересом. Команда — одна из сильнейших в мировой академической робототехнике. Идея адресует реальную, острую проблему индустрии — фрагментацию и запредельную стоимость разработки AI для каждого нового робота. Финансирование достаточное для нескольких лет интенсивной, бескомпромиссной работы. Но мы также помним, что между хорошей идеей, сильной командой и достаточным финансированием — с одной стороны — и работающим, масштабируемым, коммерчески успешным продуктом в робототехнике — с другой — обычно лежит от пяти до десяти лет тяжёлой, непредсказуемой, часто разочаровывающей инженерной работы. Посмотрим, что Skild покажет через год — и будем судить по результатам, а не по раундам финансирования.
Верите ли вы в концепцию «универсального мозга» для роботов — единой модели, которая управляет любым роботом в любых условиях, — или каждый тип робота всегда будет требовать специализированную AI-модель, тонко заточенную именно под его уникальные задачи, конструкцию и условия работы?
Хотите получать подобные материалы раньше?
Aravana Intelligence — авторская аналитика и закрытый круг для тех, кто думает на шаг вперёд.
Узнать про Intelligence1X NEO: первый гуманоидный робот, который можно предзаказать домой
Норвежская 1X Technologies открыла предзаказы на NEO — гуманоидного робота для дома.
Boston Dynamics показала коммерческий Atlas на CES 2026: что изменилось и зачем это важно
Boston Dynamics представила коммерческую версию электрического Atlas на CES 2026. Разбираем, что нового, кто первые клиенты и почему это поворотный момент для индустрии.
Китай отгрузил 13 000 гуманоидных роботов за 2025 год: как это меняет расстановку сил
Китайские компании доминируют в отгрузках гуманоидных роботов — около 13 000 единиц за 2025 год. Разбираем цифры, ключевых игроков и что это значит для глобального рынка.