En annen ny målestokk: - OpenAI er mest kostnadseffektivt på tvers av oppgaver; GPT-5 (høy resonnement) er sterk på pris + intelligens - Antropisk leder rå suksess (topp to; rask på vanskelige oppgaver) benchmark-testene ende-til-ende-kompilering av ekte OSS under rotete, virkelige forhold