Další nový benchmark: - OpenAI je nákladově nejefektivnější napříč úkoly; GPT-5 (vysoké zdůvodnění) je silný na cenu + inteligenci - Antropický vede k hrubému úspěchu (první dva; rychlý na těžké úkoly) benchmark testuje komplexní kompilaci skutečného OSS v chaotických podmínkách reálného světa