1X sier at deres NEO-humanoid nå kjører en video-pretrained "world model"-policy som genererer en tekstbetinget videorulling, og deretter konverterer en invers dynamikkmodell frames til robothandlinger.