人們在評估 AI 研究的進展速度時,最常見的錯誤之一是只關注某一類任務的進展,並將其推廣到所有人類能夠完成的任務上。 AI 的進展在特定領域上非常垂直。過去一年,可驗證的領域,特別是代碼,顯示出快速的進展,但這並不延伸到其他領域。這是因為 AI 能力的主要驅動力至今仍然是對過去數據的記憶和操作化,而在可驗證的領域中,這些數據可以無限量生成。