Predecir el orden de los próximos tokens mejora el modelado del lenguaje
8.96K