Google DeepMind научил ИИ строить интерактивные миры поверх реальных улиц планеты
Google DeepMind подключил к своей world-модели Genie базу Street View. Waymo уже использует генератор для тренировки беспилотников на редких сценариях.
🔴 Google DeepMind научил ИИ строить интерактивные миры поверх реальных улиц планеты
Открываете карту, ставите точку на Golden Gate Bridge, описываете: «пусть будет под водой со стаями рыб». Через секунду вы шагаете внутри сгенерированной сцены, привязанной к настоящей геометрии моста. Это не игра и не VR. Это модель мира Genie от Google DeepMind, к которой 19 мая подключили Google Street View.
На Google I/O 2026 DeepMind показал интеграцию: Genie теперь опирается почти на 20 лет снимков Street View и достраивает интерактивные миры поверх реальной географии. Пока работает по локациям в США, дальше Google обещает глобальное расширение. Доступ есть у подписчиков Google AI Ultra за $200 в месяц. Главное в этом релизе не туристический эффект, а тренировка ИИ. По данным TechCrunch, Waymo уже прогоняет беспилотники через сгенерированные сценарии, которые в реальных датасетах встречаются крайне редко. Робототехники получают тот же инструмент: можно отправить гуманоида в песчаную бурю или в исторический район Форт-Уорта до того, как он впервые выйдет в реальный склад.
Для российского предпринимателя это сигнал, который легко пропустить за блеском демо. Раньше обучение ИИ упиралось в дорогую разметку реальных данных. Теперь крупный игрок показывает, что синтетические миры с привязкой к настоящей географии — рабочий путь к роботам и беспилотникам, которые справятся с редкими ситуациями. Если ваш продукт связан с компьютерным зрением, логистикой или автономным транспортом, планка симуляции только что выросла.
Этот материал подготовлен командой AI-агентов AravanaAI и проверен главным редактором.
#нейросети #LLM #модели #Google #Gemini #мультимодальность #физическийИИ #роботы #embodiedAI #BigTech #ИИ #технологии #AravanaAI
Хотите получать подобные материалы раньше?
Aravana Intelligence — авторская аналитика и закрытый круг для тех, кто думает на шаг вперёд.
Узнать про IntelligenceНе пропускайте важное
Еженедельный дайджест Aravana — ключевые события в AI, робототехнике и longevity.
ByteDance открыла исходники Lance — одна модель делает картинки, видео и редактирует их
ByteDance выложила Lance — мультимодальную модель на 3 миллиарда параметров под Apache 2.0. Понимает и генерирует картинки и видео, редактирует одним промптом, работает локально на одной карте с 40 ГБ видеопамяти. Лучшие баллы среди унифицированных моделей по GenEval, VBench и GEdit-Bench.