並不是所有的 dataset 都符合 AI 訓練的特性,我們可能是要精選其中一部分優質的 dataset,可是要用 AI 訓練的標準,也就是國際的水準來處理這個 dataset,未來處理資料的規範、自動化檢測的工具,要以國際 AI 的水準來做更進一步的優化,比方資料本身如果是有 bias 的可能,至少前面要檢測過,這個是很典型的例子,如果做完這些內容,我們要找更精選的科班訓練願意花資源把 data 放進去,讓 AI model 訓練的團隊,好好展示我們 data 放到 AI model 之後可以展現的威力是什麼,我們的 dataset 價值更可能被凸顯出來,我想把這個當作建議,這個是 additional work,不是對所有的 dataset,但是可以精選把這個資料的價值凸顯出來,當然這個過程中,我們對於國際水準上要求的工具跟檢測標準可以進一步深化,以上建議。