Skild AI привлекает $1,4 млрд при оценке $14 млрд: универсальный мозг для роботов

Стартап Skild AI закрыл раунд на $1,4 млрд при оценке $14 млрд. Компания разрабатывает универсальную AI-модель для управления любыми роботами.

Aravana·2026-01-14·9 мин

14 января 2026 года питтсбургский стартап Skild AI объявил о закрытии раунда финансирования на 1,4 миллиарда долларов при оценке компании в 14 миллиардов. Это один из крупнейших раундов в истории робототехники и один из немногих случаев, когда компания с менее чем 100 сотрудниками и практически нулевой выручкой получает оценку, превышающую капитализацию многих публичных промышленных компаний. Раунд возглавили Lightspeed Venture Partners и SoftBank Vision Fund 2, с участием Amazon (через подразделение AWS Industrial Innovation), Coatue Management, Jeff Bezos Expeditions, нескольких суверенных фондов Ближнего Востока, включая Mubadala Investment Company из Абу-Даби и Saudi Aramco Ventures. Мы попробуем разобраться, что именно инвесторы увидели в Skild AI, что заставило их выписать чеки на такие суммы.

Skild AI основана двумя профессорами из Университета Карнеги-Меллона — одного из трёх-четырёх лучших в мире университетов в области робототехники и AI. Абхинав Гупта — эксперт в компьютерном зрении, самообучающихся системах и мультимодальном AI, автор более 200 научных работ, цитируемых суммарно более 50 000 раз. Дипак Патхак — специалист по обучению с подкреплением (reinforcement learning), любопытство-направленному обучению (curiosity-driven learning) и робототехническому AI, один из пионеров применения современных нейросетевых методов к управлению физическими роботами. Оба — рецензенты ведущих конференций NeurIPS, ICML, CVPR, оба консультировали Google, Meta и NVIDIA, прежде чем основать Skild. Их центральная идея звучит одновременно просто в формулировке и грандиозно в амбициях: создать foundation model для робототехники — единую, универсальную AI-модель, которая может управлять любым роботом, от шестиосного промышленного манипулятора до двуногого гуманоида, от квадрупода до дрона, без необходимости обучать отдельную, специализированную модель под каждый конкретный тип оборудования.

Универсальная модель для любых роботов

Аналогия, которую основатели используют в каждом публичном выступлении: GPT стал универсальной моделью для текста, DALL-E и Midjourney — для изображений, Sora — для видео, а Skild станет универсальной моделью для физического мира. Одна модель, обученная на колоссальном массиве данных о движении, взаимодействии с объектами, навигации в трёхмерном пространстве и физических свойствах материалов, которая затем адаптируется к конкретному роботу с его уникальной кинематикой за часы или дни тонкой настройки (fine-tuning), а не за месяцы или годы полного обучения с нуля. На слайдах и в презентациях это выглядит красиво, логично, неизбежно — как следующий естественный шаг после языковых и визуальных foundation models. Вопрос, как всегда и во всём в робототехнике, — в чудовищной сложности реализации, в том зазоре между элегантной идеей и работающим продуктом.

Мы подробно изучили всё, что Skild показала публично за полтора года существования: демонстрации на конференциях CoRL 2025 и NeurIPS 2025, техническую публикацию в arxiv (препринт, не прошедший полное рецензирование), видеоматериалы на сайте и в YouTube, интервью основателей для Bloomberg, TechCrunch и IEEE Spectrum. Компания демонстрировала свою модель на шести принципиально различных робототехнических платформах: двух гуманоидах (Unitree G1 и 1X NEO в ранней версии), промышленном манипуляторе Franka Emika Panda, четвероногом роботе (квадруподе Unitree Go2), гексакоптерном дроне и мобильной колёсной платформе Clearpath Robotics. Во всех шести случаях использовалась одна и та же базовая модель с минимальной платформо-специфичной донастройкой — Skild заявляет, что адаптация к новой робототехнической платформе требует от 2 до 8 часов вычислений на одном GPU кластере уровня A100 или H100, при условии наличия URDF-описания (стандартный формат описания кинематики робота). Роботы на демонстрациях выполняли набор задач: захват объектов различной формы и веса (от теннисного мяча до бутылки с водой), обход заранее не размеченных препятствий (стулья, коробки), реакция на неожиданные изменения (человек перемещал объект во время попытки захвата, и робот корректировал траекторию). Впечатляюще — но с существенными оговорками: лабораторные условия, ограниченный и заранее определённый список задач, контролируемое освещение и фон, отсутствие тонких манипуляций (работа с хрупкими объектами, точная сборка) и взаимодействия в тесном, загромождённом пространстве.

Техническая архитектура Skild — мультимодальная трансформерная модель с несколькими специализированными энкодерами для разных типов входных данных. Визуальный энкодер обрабатывает изображения с камер (RGB и depth), проприоцептивный энкодер принимает данные о состоянии суставов (позиция, скорость, усилие), тактильный энкодер обрабатывает сигналы от датчиков давления и текстуры (если они есть на конкретном роботе), языковой энкодер интерпретирует текстовые или голосовые инструкции. Все эти модальности объединяются в общее латентное представление, из которого декодер генерирует последовательность управляющих команд — целевые позиции суставов с временными метками. Модель обучена на трёх типах данных суммарным объёмом, по заявлению Skild, более 2 миллионов часов робототехнических взаимодействий. Первый источник — видео реальных робототехнических операций от академических лабораторий и промышленных партнёров (около 200 000 часов). Второй — синтетические данные из симуляций в средах Isaac Sim, MuJoCo и собственном симуляторе Skild (около 1,5 миллиона часов). Третий — видеозаписи людей, выполняющих бытовые и производственные задачи (около 300 000 часов YouTube-видео и приватных датасетов), которые модель использует для извлечения паттернов манипуляции без прямого робототехнического контроля. Доминирование синтетических данных (более 75 процентов обучающей выборки) — и наиболее инновационный, и наиболее рискованный аспект подхода: sim-to-real transfer (перенос навыков из симуляции в реальный мир) остаётся одной из центральных и до конца не решённых проблем робототехнического AI.

Технология и архитектура платформы

Оценка в 14 миллиардов долларов для компании без значительной выручки и с продуктом в стадии раннего тестирования требует объяснения, выходящего за рамки обычного венчурного оптимизма. Мы попытались реконструировать логику инвесторов. Если Skild создаст работающую универсальную модель и станет поставщиком «операционной системы» или «мозга» для робототехнической индустрии, потенциальный рынок колоссален. Goldman Sachs прогнозирует, что к 2035 году в мире будет работать от 10 до 50 миллионов роботов с AI-управлением (включая гуманоидных, промышленных, логистических и сервисных). При модели SaaS-подписки — скажем, 500 долларов в месяц за робота (6 000 долларов в год) — и парке в 20 миллионов роботов, это 120 миллиардов долларов ежегодной выручки. Даже при 5-процентной доле рынка — 6 миллиардов. При мультипликаторе 10x для SaaS-бизнеса — оценка в 60 миллиардов. С этой перспективы 14 миллиардов сегодня — агрессивно, но не безумно. Всё держится на двух критических допущениях: «если создаст» и «если рынок материализуется». Оба — серьёзные «если».

Наша оценка: конкурентная среда на рынке robot foundation models — возможно, самая интенсивная и высококонцентрированная в истории AI. NVIDIA разрабатывает GR00T N1, подкреплённый собственной аппаратной экосистемой (Jetson Thor) и инструментами для симуляции (Isaac Sim, Omniverse). Google DeepMind параллельно развивает линейку RT-моделей (RT-1, RT-2, RT-X, RT-H) с доступом к вычислительным ресурсам Google и десяткам роботов в собственных лабораториях. Physical Intelligence — стартап, основанный бывшими исследователями Google Brain, Stanford и Berkeley — привлёк 400 миллионов долларов на создание foundation model с фокусом на манипуляционные задачи и показал впечатляющие результаты с diffusion policy подходом. Toyota Research Institute публикует передовые работы по diffusion policy моделям и имеет бюджет в миллиард долларов на AI-робототехнику. Covariant (бывший сотрудник OpenAI Питер Чен) разрабатывает RFM-1 (Robot Foundation Model) специализированно для складских операций. MIT CSAIL, Stanford AI Lab, Berkeley BAIR, CMU Robotics Institute — десятки ведущих лабораторий ведут параллельные исследования с открытыми публикациями. Рынок robot foundation models находится в фазе «кембрийского взрыва», и определить победителя сегодня так же невозможно, как предсказать в 2015 году, что GPT от OpenAI станет доминирующей парадигмой в NLP.

Мы видим в подходе Skild как серьёзные сильные стороны, так и фундаментальные, системные риски. Главная сильная сторона — фокус на обобщении и кросс-платформенности: одна модель для разных роботов. Если это работает на практике (а не только в демонстрациях), это радикально меняет экономику внедрения AI в робототехнику. Сегодня компания, которая хочет добавить AI-навыки в своего робота, должна нанять команду из 30-50 ML-инженеров (годовой фонд оплаты — 5-10 миллионов долларов), потратить 12-18 месяцев на сбор данных, обучение модели и тестирование, и повторять этот процесс для каждого нового робота или существенного изменения задачи. Если Skild предлагает API, к которому можно подключить робота и получить базовые навыки манипуляции и навигации за часы — это снижение барьера входа на порядок. Это бизнес-модель в стиле AWS для физического мира.

Фундаментальный риск — в том, что задача создания универсальной модели для физического мира может оказаться качественно, а не количественно, сложнее, чем создание языковых или визуальных моделей. Текст — это последовательность токенов в дискретном пространстве с чёткими правилами грамматики и семантики. Изображение — это массив пикселей в двумерном пространстве. Физический мир — это бесконечно-мерное, непрерывное, стохастическое пространство, где каждый объект имеет массу, инерцию, центр тяжести, коэффициенты трения (статический и динамический, разные для разных пар поверхностей), упругость, хрупкость, деформируемость. Каждая поверхность имеет свои свойства, которые меняются от температуры, влажности, загрязнения, износа. Каждый робот имеет уникальную кинематику с люфтами в суставах, которые увеличиваются со временем, нелинейностями в двигателях, задержками в датчиках, деформацией корпуса под нагрузкой. Создать одну модель, которая надёжно обобщает всё это разнообразие и генерирует безопасные, точные, своевременные действия в реальном времени — задача, масштаб которой, вероятно, на порядки превышает создание GPT-4 или DALL-E 3. Мы не утверждаем, что это невозможно — история технологий полна примеров решения «невозможных» задач. Мы говорим, что оценка в 14 миллиардов подразумевает уровень уверенности в успехе, который, на наш взгляд, пока не подкреплён достаточным количеством публичных доказательств.

Конкуренция и перспективы рынка

Использование привлечённых 1,4 миллиарда заслуживает отдельного анализа. По данным из пресс-релиза и интервью основателей, распределение примерно следующее: 60 процентов (около 840 миллионов) — на вычислительные ресурсы для обучения моделей, включая аренду и строительство GPU-кластеров (Skild использует чипы NVIDIA H100 и B200, и по масштабу вычислений конкурирует за ресурсы с крупнейшими AI-лабораториями); 20 процентов (280 миллионов) — на расширение и диверсификацию датасета: покупка данных от робототехнических компаний, построение собственных лабораторий для сбора реальных (не симулированных) данных, развитие партнёрств с производителями роботов; оставшиеся 20 процентов (280 миллионов) — на наём (Skild набирает PhD-специалистов по робототехнике и ML, предлагая зарплаты 300-500 тысяч долларов в год, конкурентные с Google, Meta и OpenAI), аренду офисов и лабораторий, юридические расходы и операционные нужды. При таком burn rate (скорости расходования капитала) — по нашим оценкам, 300-500 миллионов долларов в год — привлечённых средств хватит на 3-4 года интенсивной работы. Если к этому времени компания не покажет коммерчески жизнеспособный продукт — потребуется новый раунд на ещё более амбициозных условиях.

Для робототехнической индустрии в целом мега-раунд Skild AI несёт структурный, возможно эпохальный сигнал. Инвесторы самого высокого калибра — SoftBank, Amazon, суверенные фонды — своими деньгами голосуют за то, что «мозг робота» — это отдельный, самостоятельный и потенциально огромный рынок, а не неотделимая часть бизнеса по производству самих роботов. Если эта ставка верна, индустрия может разделиться по модели, знакомой нам по рынку персональных компьютеров и смартфонов: одни компании делают «тела» (hardware — рамы, актуаторы, сенсоры, батареи), другие делают «мозги» (foundation models, операционные системы, runtime-среды), третьи — интегрируют всё вместе и продают конечным клиентам с вертикальной специализацией. Qualcomm делает чипы, Google делает Android, Samsung собирает устройства, Uber создаёт сервис. В робототехнике: Unitree или Boston Dynamics производят роботов, Skild или NVIDIA поставляют AI-модели и платформы, системные интеграторы вроде Accenture или Siemens адаптируют решения для конкретных отраслей.

Мы относимся к Skild AI с осторожным, но искренним интересом. Команда — одна из сильнейших в мировой академической робототехнике. Идея адресует реальную, острую проблему индустрии — фрагментацию и запредельную стоимость разработки AI для каждого нового робота. Финансирование достаточное для нескольких лет интенсивной, бескомпромиссной работы. Но мы также помним, что между хорошей идеей, сильной командой и достаточным финансированием — с одной стороны — и работающим, масштабируемым, коммерчески успешным продуктом в робототехнике — с другой — обычно лежит от пяти до десяти лет тяжёлой, непредсказуемой, часто разочаровывающей инженерной работы. Посмотрим, что Skild покажет через год — и будем судить по результатам, а не по раундам финансирования.

Верите ли вы в концепцию «универсального мозга» для роботов — единой модели, которая управляет любым роботом в любых условиях, — или каждый тип робота всегда будет требовать специализированную AI-модель, тонко заточенную именно под его уникальные задачи, конструкцию и условия работы?

Этот материал подготовлен командой AI-агентов AravanaAI и проверен главным редактором.

Тип материала: Анализ

Поделиться:Telegram X LinkedIn

Как вам материал?

Atlas будет тягать по 50 кг, а Hyundai планирует 30 000 роботов в год

Boston Dynamics показал, как Atlas поднимает 50 кг через проприоцепцию, а Hyundai планирует выйти на 30 000 единиц Atlas в год к 2028-му.

2026-05-20·1 мин

Robotics·Срочное

Робот разбил яйцо одной рукой и сыграл на пианино — Genesis AI

Genesis AI представил GENE-26.5 — модель, которая управляет роботизированной рукой на уровне человека: готовка, пипетки, пианино, Кубик Рубика.

2026-05-07·1 мин

Robotics·Срочное

Hyundai построит завод на 30 000 гуманоидов Atlas в год к 2028

Hyundai планирует выпускать 30 000 гуманоидных роботов Atlas в год к 2028 — рост производства в 625 раз.

2026-05-06·1 мин