ein weiterer neuer Maßstab: - OpenAI ist bei Aufgaben am kosteneffizientesten; GPT-5 (hohe Denkfähigkeit) ist stark in Bezug auf Preis + Intelligenz - Anthropic führt bei rohem Erfolg (Top zwei; schnell bei schwierigen Aufgaben) die Benchmark-Tests umfassen das End-to-End-Compiling von echtem OSS unter chaotischen, realen Bedingungen