私たちは、拡張されたソフトウェアタスク群において「高い」(xhighではなく)推論努力を持つGPT-5.2の50%の時間範囲は約6.6時間(95%信頼区間は3時間20分から17時間30分)と推定しています。これはこれまでに報告された時間範囲の測定値としては最高です。