只有當你堅持打造一個全知型系統時,才會如此。大型模型必須把一切都記住——每部電影、每種風格、每個領域——因為它不知道你下一個問題會是什麼。它之所以連吉卜力都要背下來,是因為它無法預知你下一句會不會說:「把這張圖做成吉卜力風格。」但如果你知道自己的具體需求,絕大多數參數其實都不必要。一個只負責英藏翻譯的模型,可能在一兆參數中只需要十億。原本必須放在大型資料中心裡的東西,忽然就能塞進手機。蘋果就是這樣做模型的:一個小模型負責電子郵件摘要,一個負責翻譯,另一個負責特定功能。它們全都放得進裝置裡,能耗也低得多。