L'IA Genie 3 de Google crée des mondes virtuels interactifs qui durent des minutes au lieu de secondes

Par
CTOL Editors - Ken
2 min de lecture

Le Moteur de la Réalité : Comment Genie 3 de Google Redéfinit les Règles du Jeu de l'IA

MOUNTAIN VIEW, Californie — Derrière les murs discrets du campus de recherche de Google DeepMind, un changement discret mais profond est en cours – un changement qui pourrait remodeler notre façon d'interagir avec l'intelligence artificielle et la réalité simulée.

Au cœur de cette transformation se trouve Genie 3, la dernière percée de Google en matière de modélisation de mondes. C'est plus qu'une simple amélioration dans la génération de vidéo par IA ; cela jette les bases de quelque chose de bien plus grand : un monde numérique persistant et interactif qui pourrait alimenter la prochaine vague d'intelligence artificielle générale (IAG).

Contrairement aux modèles précédents qui produisaient de courts clips vidéo déconnectés, Genie 3 peut générer des environnements 3D riches et cohérents qui persistent pendant plusieurs minutes. Ces mondes virtuels ne sont pas seulement visuellement impressionnants — ils mémorisent les objets, maintiennent une physique interne et s'adaptent à l'interaction de l'utilisateur, le tout sans être explicitement programmés. Les applications potentielles vont du divertissement à la robotique et à la formation industrielle, annonçant une transformation prochaine d'industries entières.

Scènes générées par Genie 3
Scènes générées par Genie 3


Quand quelques minutes semblent une éternité

Sur le papier, le saut de Genie 2 à Genie 3 pourrait sembler minime. Alors que Genie 2 pouvait maintenir la cohérence pendant 10 à 20 secondes, Genie 3 étend cette durée à 2 ou 3 minutes. Mais ce bond est plus que purement quantitatif — il est transformateur, comparable au passage d'une photo figée à une simulation vivante et respirante.

Les premiers utilisateurs – s'exprimant sous couvert d'anonymat en raison d'accords de non-divulgation (NDA) – décrivent un système qui défie les attentes. « La cohérence sur plusieurs minutes en 720p dépasse ce que la plupart considéraient comme possible », a déclaré un chercheur.

Ce qui est le plus remarquable, ce n'est pas seulement la qualité de l'image, mais la capacité du modèle à se souvenir. Les objets restent cohérents même après avoir quitté le cadre, ce qui suggère de profondes innovations architecturales. Les experts pensent que cela est alimenté par un « transformateur causal avec une tête de mémoire spatio-temporelle » — un détail que DeepMind n'a pas encore entièrement divulgué, mais qui pourrait être aussi significatif que le saut visuel lui-même.


Une nouvelle frontière : l'intelligence incarnée

Genie 3 n'est pas seulement une prouesse technique — c'est une prouesse stratégique. Il marque l'investissement audacieux de Google dans l'IA incarnée, où l'intelligence est

Vous aimerez peut-être aussi

Cet article est soumis par notre utilisateur en vertu des Règles et directives de soumission de nouvelles. La photo de couverture est une œuvre d'art générée par ordinateur à des fins illustratives uniquement; ne reflète pas le contenu factuel. Si vous pensez que cet article viole les droits d'auteur, n'hésitez pas à le signaler en nous envoyant un e-mail. Votre vigilance et votre coopération sont inestimables pour nous aider à maintenir une communauté respectueuse et juridiquement conforme.

Abonnez-vous à notre bulletin d'information

Obtenez les dernières nouvelles de l'entreprise et de la technologie avec des aperçus exclusifs de nos nouvelles offres

Nous utilisons des cookies sur notre site Web pour activer certaines fonctions, fournir des informations plus pertinentes et optimiser votre expérience sur notre site Web. Vous pouvez trouver plus d'informations dans notre Politique de confidentialité et dans nos Conditions d'utilisation . Les informations obligatoires se trouvent dans les mentions légales