嗯,時間表更短,這是你的意思。而且這不會改變政策權衡。基本上,需要有一個引導程序(bootstrap sequence)。你需要先想出,例如,一個「後轉換器」(post-transformer)、「後注意力」(post-attention)。例如,隨便舉個例子,Manifest AI 的 Power Retention 網路。那是較好的候選者之一。