Demis Hassabis dit que les modèles du monde sont sa passion de longue date et explique les avantages par rapport aux modèles linguistiques : ▫️ "Je pense que les modèles linguistiques sont capables de comprendre beaucoup de choses sur le monde. Plus que nous ne l'avions prévu, car le langage est en réalité probablement plus riche que ce que nous pensions. Mais il y a encore beaucoup de choses sur la dynamique spatiale du monde, la conscience spatiale et le contexte physique dans lequel nous nous trouvons — et comment cela fonctionne mécaniquement — qui est difficile à décrire avec des mots et qui n'est généralement pas décrit dans des corpus de mots. Beaucoup de cela est lié à l'apprentissage par l'expérience. Il y a beaucoup de choses que vous ne pouvez pas vraiment décrire. Vous devez juste les vivre. Peut-être que les sens et ainsi de suite sont très difficiles à mettre en mots. Que ce soit les angles moteurs et l'odorat et ces types de sens, il est très difficile de décrire cela dans n'importe quel type de langage."▫️ C'est ce que Demis et Google Deepmind essaient de résoudre avec Genie. Il dit aussi que les modèles vidéo (Veo) joueront un rôle dans l'entraînement des modèles du monde et que tout cela est essentiel pour la robotique AI.