een nieuwe benchmark: - OpenAI is het meest kostenefficiënt over taken; GPT-5 (hoge redenering) is sterk op prijs + intelligentie - Anthropic leidt in ruwe succes (top twee; snel bij moeilijke taken) de benchmarktests omvatten end-to-end compilatie van echte OSS onder rommelige, echte wereldomstandigheden