Ett annat nytt riktmärke: - OpenAI är mest kostnadseffektivt för alla uppgifter; GPT-5 (high reasoning) är stark på pris + intelligens - Antropisk leder rå framgång (topp två; snabb på svåra uppgifter) Benchmark-testet testar kompilering från början till slut av verkliga OSS under stökiga, verkliga förhållanden