即使最強烈的批評者——如 Eliezer Yudkowsky 與 MIRI 的同事——也呼籲在機制式可解釋性、可校正性(corrigibility)與可說明性(explainability)上投入更多工作。問題在於落差:投入能力建構的資源比安全多出一個數量級。