1X säger att deras NEO-humanoid nu kör en video-förtränad "världsmodell"-policy som genererar en textkonditionerad videoutrullning, och sedan omvandlar en inversdynamisk modell bildrutor till robothandlingar.