就像 RNN 和 LSTM,它的機械可解釋性要高得多,因為它只使用線性記憶體和電力來處理任意長的上下文視窗。所以它更適合這種體驗式學習,而且也更好訓練,因為你可以拿一個轉換器並將其重新訓練為 Power Retention。但不一定要是 Power Retention。可以是其他任何東西。