Google DeepMind научил ИИ строить интерактивные миры поверх реальных улиц планеты

Google DeepMind подключил к своей world-модели Genie базу Street View. Waymo уже использует генератор для тренировки беспилотников на редких сценариях.

Aravana··1 мин

🔴 Google DeepMind научил ИИ строить интерактивные миры поверх реальных улиц планеты

Открываете карту, ставите точку на Golden Gate Bridge, описываете: «пусть будет под водой со стаями рыб». Через секунду вы шагаете внутри сгенерированной сцены, привязанной к настоящей геометрии моста. Это не игра и не VR. Это модель мира Genie от Google DeepMind, к которой 19 мая подключили Google Street View.

На Google I/O 2026 DeepMind показал интеграцию: Genie теперь опирается почти на 20 лет снимков Street View и достраивает интерактивные миры поверх реальной географии. Пока работает по локациям в США, дальше Google обещает глобальное расширение. Доступ есть у подписчиков Google AI Ultra за $200 в месяц. Главное в этом релизе не туристический эффект, а тренировка ИИ. По данным TechCrunch, Waymo уже прогоняет беспилотники через сгенерированные сценарии, которые в реальных датасетах встречаются крайне редко. Робототехники получают тот же инструмент: можно отправить гуманоида в песчаную бурю или в исторический район Форт-Уорта до того, как он впервые выйдет в реальный склад.

Для российского предпринимателя это сигнал, который легко пропустить за блеском демо. Раньше обучение ИИ упиралось в дорогую разметку реальных данных. Теперь крупный игрок показывает, что синтетические миры с привязкой к настоящей географии — рабочий путь к роботам и беспилотникам, которые справятся с редкими ситуациями. Если ваш продукт связан с компьютерным зрением, логистикой или автономным транспортом, планка симуляции только что выросла.

Этот материал подготовлен командой AI-агентов AravanaAI и проверен главным редактором.

#нейросети #LLM #модели #Google #Gemini #мультимодальность #физическийИИ #роботы #embodiedAI #BigTech #ИИ #технологии #AravanaAI

Тип материала: Пост из Telegram

Поделиться:TelegramXLinkedIn
Как вам материал?

Хотите получать подобные материалы раньше?

Aravana Intelligence — авторская аналитика и закрытый круг для тех, кто думает на шаг вперёд.

Узнать про Intelligence

Не пропускайте важное

Еженедельный дайджест Aravana — ключевые события в AI, робототехнике и longevity.

Похожие материалы

ByteDance открыла исходники Lance — одна модель делает картинки, видео и редактирует их

ByteDance выложила Lance — мультимодальную модель на 3 миллиарда параметров под Apache 2.0. Понимает и генерирует картинки и видео, редактирует одним промптом, работает локально на одной карте с 40 ГБ видеопамяти. Лучшие баллы среди унифицированных моделей по GenEval, VBench и GEdit-Bench.

·1 мин

Китайский StepFun выпустил голосовую модель, которая ловит интонации и не выпадает из роли

Шанхайская лаборатория StepFun представила StepAudio 2.5 Realtime — голосовую модель, которая слышит тон и паузы и держит выбранный персонаж в долгих диалогах.

·1 мин

Следующая модель OpenAI уже готова — её держат в «безопасной комнате»

OpenAI завершила предобучение следующей frontier-модели (кодовое имя Spud) ещё 24 марта — сейчас она проходит проверку безопасности. Polymarket даёт 78% шанс на выход до конца апреля.

·1 мин