kolejny nowy punkt odniesienia: - OpenAI jest najbardziej opłacalny w różnych zadaniach; GPT-5 (wysokie rozumowanie) jest mocny pod względem ceny + inteligencji - Anthropic prowadzi w surowych wynikach (w pierwszej dwójce; szybki w trudnych zadaniach) testy punktów odniesienia kończą się kompilacją rzeczywistego OSS w chaotycznych, rzeczywistych warunkach