而「社群回饋強化學習」所訓練的 AI 系統,不是「垂直地」對齊單一使用者,而是「橫向地」對齊人與人之間的關係。如果 AI 發布的備註能夠修補分歧,它就會得到獎勵。這種訓練 AI 的方式,從根本上就是「合作式 AI」(Cooperative AI),這也是我目前的研究方向。
j previous speech k next speech