Eine meiner Lieblingsmethoden, um ein Video-Generierungsmodell zu testen, besteht darin, es zu bitten, eine Schwertkampfszene zu generieren.
Die Physik ist *wirklich* schwer richtig hinzubekommen.
@LumaLabsAI's Ray3 erreicht immer noch nicht annähernd eine akzeptable Qualität, aber es ist bei weitem das beste Modell, das ich ausprobiert habe.
Ich habe das neue GPT-5-Codex-Modell ziemlich intensiv getestet.
Hier ist mein aktuelles Denken:
Ist es insgesamt besser als das reguläre GPT-5 high?
Absolut nicht.
Aber wenn man es richtig einsetzt, kann es das Vanilla GPT-5 high übertreffen.
Was ich meine:
Wenn man wahnsinnig detaillierte Eingabeaufforderungen schreibt (im Wesentlichen vollständige, umfassende Spezifikationen/wahnsinnig eindeutige Anweisungen), ist es merklich besser.
Es kann länger denken und arbeiten, über mehr Code kohärent bleiben usw.
Und für wirklich einfache Anfragen ist es ja, es ist VIEL schneller.
Aber es ist VIEL schlechter im Verständnis der Absicht, also bei allem, was auch nur etwas vage ist, ist es viel schlechter als das reguläre GPT-5.
Ich werde wahrscheinlich vorerst zwischen Codex und regulärem GPT-5 high hin und her wechseln!
Ich habe das neue GPT-5-Codex-Modell wirklich intensiv getestet.
Hier ist mein aktuelles Denken:
Ist es insgesamt besser als das reguläre GPT-5 high?
Absolut nicht.
Aber wenn man es richtig einsetzt, kann es das Vanilla GPT-5 high übertreffen.
Was ich meine:
Wenn du wahnsinnig detaillierte Eingabeaufforderungen schreibst (im Wesentlichen vollständige, umfassende Spezifikationen/wahnsinnig eindeutige Anweisungen), ist es besser.
Es kann länger denken und arbeiten, über mehr Code kohärent bleiben usw.
Und für wirklich einfache Anfragen ist es ja, es ist VIEL schneller.
Aber es ist VIEL schlechter im Verständnis der Absicht, also bei allem, was auch nur etwas vage ist, ist es viel schlechter als das reguläre GPT-5.
Ich werde wahrscheinlich vorerst zwischen Codex und regulärem GPT-5 high hin und her wechseln!