no disminuimos la velocidad hasta que tenemos modelos STOA a 1000 tokens por segundo. Luego cruzamos el horizonte de eventos de lo que es posible.
485