單薄的指標——阿拉丁神燈/寄生 AI 問題——會導致諂媚、成癮、過度依賴、權力集中和失控的風險。水平對齊則使用像 X/Twitter 上的「社群備註」(Community Notes)那樣的橋接演算法——這直接受到 Pol.is 的啟發。備註之所以被凸顯,不是因為多數決,而是因為它能橋接兩極化的陣營。最近 AI 甚至可以「草擬」這樣的橋接備註。X 開放了 API,所以你可以接入 Mistral、gpt-oss 等模型,並得到人類的投票。這是一種基於「社群」回饋的強化學習。當先前兩極化的陣營更能理解彼此時,AI 就會得到獎勵——最大化某個社群內的「關係健康」。當社群療癒了,AI 的工作就完成了;它就功成身退。面對許多垂直對齊的失敗模式和關於存在風險的討論,這是個很有前景的方向。