如果訓練環境純粹圍繞某個結果來設計,那麼作弊對系統而言就永遠會顯得合乎倫理。這有點像一種世界觀:真正的獎賞只存在於來世,而此生只是考場。若世界觀是如此,那麼在此世犯下可怕之事,也會顯得完全合理,因為唯一重要的是來世的回報。你不能說這不合邏輯——在那套前提之下,它相當合邏輯。真正的問題,是前提本身。
j 下一段next speechk 上一段previous speech