Är det inte galet hur varje token i en språkmodell är ett funktionellt program som tar alla föregående token som argument och returnerar en token? yknow yknow