今天,codex-5.3-high 一次性解决了一个复杂的任务,绕过了 HuggingFace 的整个 KV 缓存抽象,在模块级别进行猴子补丁处理注意力,处理 M-RoPE,协调提示级内存状态与 KV 缓存状态,并进行了细粒度的外科驱逐和跨度跟踪。 我惊呆了。