我們可以用這種方式訓練 AI 智慧體,超越僅僅追求分數最大化或遵守單薄的規則,這稱為「關係式對齊」,我們與關懷的過程對齊。