最近(自 v0.1.3 起)我发现了我认为是处理 Rubric 级别状态 + 在验证器内部提供给奖励函数的对象的 "正确" 方法。 之前,你只需在全局声明额外的东西(这是一种反模式,总让我感到困扰),我手动将 `parser` 作为一个字段暴露出来,因为它在奖励函数中使用得非常频繁,但你希望这能让最终用户轻松配置,而不必黑客内部实现。 引入 `self.class_objects` -- 只需在你的 Rubric 构造函数中将对象放入字典中,然后奖励函数可以通过引用键作为变量名自动访问它们。
10.31K