otro nuevo estándar: - OpenAI es el más rentable en todas las tareas; GPT-5 (alto razonamiento) es fuerte en precio + inteligencia - Anthropic lidera el éxito bruto (top dos; rápido en tareas difíciles) las pruebas de referencia evalúan la compilación de OSS real de extremo a extremo en condiciones desordenadas y del mundo real