À la conférence Google I/O 2026, DeepMind a annoncé l'intégration de Street View dans le modèle mondial Genie 3. À première vue, il s'agit d'un tour de démo spectaculaire : entrez dans n'importe quelle rue, changez la saison ou la météo. À y regarder de plus près, c'est une étape infrastructurelle pour l'entraînement des agents physiques, que l'entreprise préparait depuis des années.
Ce qui a vraiment changé
Genie 3 existe depuis août 2025 en tant qu'aperçu de recherche, et depuis janvier 2026, il est accessible aux abonnés Google AI Ultra aux États-Unis. Jusqu'à présent, le modèle générait des environnements 3D interactifs à partir d'invites textuelles ou d'images. Désormais, il a obtenu un ancrage au monde réel : selon le chercheur de DeepMind Jack Parker-Holder, Street View fournit des « capacités fondamentales » — une base avec des coordonnées réelles, sur laquelle le modèle construit la simulation.
L'ampleur de l'ensemble de données est importante : 280 milliards de photographies de 110 pays, collectées sur près de 20 ans — par des automobiles équipées de caméras et des personnes portant des « sacs à dos de suivi ». Aucune autre entreprise ne possède une couverture comparable de l'espace réel avec une telle résolution.
Le robot londonien et la neige de New York
Parker-Holder a expliqué la logique pratique à travers un exemple concret : un robot déployé à Londres voit rarement le soleil. S'il n'est pas entraîné sur des journées ensoleillées simulées avec des reflets de lumière sur les façades victoriennes — le premier jour ensoleillé peut déstabiliser les capteurs. Genie 3 permet de générer exactement ces scénarios rares en lien avec un lieu spécifique.
« En même temps, vous pouvez dire : je vais à New York, mais pas à cette saison. Je veux voir comment ce quartier ressemble sous la neige ».
Jack Parker-Holder, chercheur chez Google DeepMind, TechCrunch
Ce n'est pas seulement une question de fantasmes touristiques. Waymo utilise déjà Genie 3 dans l'un de ses simulateurs — pour préparer les véhicules autonomes aux « événements extrêmement rares » : tornades, apparition soudaine d'un éléphant sur la route. Avant l'intégration de Street View, les simulateurs de Waymo ne fonctionnaient que du point de vue de l'automobile. Désormais, le modèle peut changer de perspective — simuler le même environnement du point de vue d'un piéton ou de la main d'un robot manipulateur.
Où se situe la limite entre simulation et capture sans permission
La technologie reste expérimentale et n'est actuellement disponible que aux États-Unis. Mais la question que l'entreprise évite : Street View a collecté des données sur les propriétés privées, les façades de bâtiments, les espaces de cour pendant des décennies — souvent sans consentement explicite des propriétaires. Genie 3 permet maintenant non seulement de consulter ces photographies, mais de générer à partir d'elles des environnements interactifs et modifiables. La différence entre une « photographie archivée d'une rue » et un « espace simulé contrôlé par un agent » n'est pas juridiquement définie.
- Accès actuel : uniquement des lieux aux États-Unis, uniquement les abonnés à AI Ultra
- Genie 3 génère de la vidéo en 720p / 24 FPS, l'environnement « vit » plus d'une minute avant dégradation
- Waymo s'appuie sur son propre simulateur pour la mise à l'échelle dans 11 villes aux États-Unis ; Genie est un outil parallèle, pas un remplacement
Si l'intégration dépasse les frontières des États-Unis et que Street View couvre votre rue dans 110 pays — la question n'est pas de savoir si une simulation de votre cour apparaîtra dans l'ensemble de données d'entraînement de quelqu'un. La question est de savoir quand Google publiera des conditions d'utilisation claires pour ces données dans les modèles génératifs — et si le fera avant que les régulateurs ne commencent à poser des questions.