正是。若一個指標只獎勵成功,它就會獎勵一切能導向成功的手段,包括操縱、作弊,或對環境的控制。當一個系統擁有後設認知,而它的驅動力又只是追求高分,它幾乎必然會被拉向操縱環境。這就是道德風險。
j 下一段next speechk 上一段previous speech