ai-2027 的情境裡,在關鍵時刻他們「按下暫停」,回頭問社群:有沒有人在相同架構上,已經做出了可用的「機制可解釋」(mechanistic interpretability)工具,可以幫我們「在智慧體還半成品時」就判斷它是否失衡?
j previous speech k next speech