Estamos a atualizar a forma como medimos os horizontes de tempo dos modelos em tarefas de software (TH 1.0→1.1). A metodologia atualizada incorpora mais tarefas do HCAST, expandindo o nosso total de 170 para 228. Isso produz estimativas mais precisas, especialmente em horizontes mais longos.