Bukankah gila bagaimana setiap token dalam model bahasa adalah program fungsional yang mengambil semua token sebelumnya sebagai argumen dan mengembalikan token? Tahu