在語言處理方面,我們有時會做「蒸餾」(distillation),有時會基於現有的開源模型進行微調。我相信臺灣有一個非常受歡迎的模型,就是以法國的 Mistral 模型為基礎,再用繁體文本在其上進行微調,讓 Mistral 能更了解臺灣的文化。所以,艱困的工作已經由 Mistral 團隊完成了,臺灣做的只是在地化,這同樣非常節能。而且您也知道,Mistral 將大量能力壓縮在一個非常小的模型中,所以它不僅節能,也讓這項技術民主化了,因為人們可以在自己的手機、筆電上運行它。