所以我們現在就是透過一個叫做 CLIP Embedding——是 OpenAI 的一個程式庫——把圖片變成跟它圖片意思類似的文字。但是它在轉文字的時候,不會洩露那個圖片裡面的人的個資。所以你就突然間手上會有一堆文字去描述那個圖片。但是這個文字是可以合法處理的,就是它不觸發兒少性影像的那個問題。然後你就分享這堆文字的描述值,就是它的 embedding。然後我就可以分散式地來訓練這種小模型。
j previous speech k next speech