個人資料去識別化程序主要是參考經濟部標準局的制定,判定直接識別欄位,如果有就直接刪除,例如資料做DATA的處理,把直接識別的欄位用一個亂碼來取代,如果沒有重新識別的要求,這樣的欄位其實是沒有意義的,所以就會直接刪除。再來是按照我們的需要來選擇未來所要釋出的欄位,而且要判定這一些欄位哪一些是間接識別,哪一些是不涉及個人的資訊,接下來是進行到風險,我們來算一下這樣的處理要把K設定多少才能滿足風險評鑑的目標。接下來是調整參數,經過處理以後,可以達到K值的紀錄。K值都處理完之後,就會有一個離群值,這邊用5%的個體回應全體50%的支配模式,意思就是如果在二十個人的群體當中,如果有一個人的收入占所有二十人的一半以上,顯然這樣的狀況、這樣的個人很容易被猜出來,如果有這樣特殊狀況的數據就要經過特別的處理。但在我們這一個例子當中,等一下會提到收入是用等分位來處理,所以離群值的狀況不會出現,也不會在這個案例當中發生。接下來是把所有處理完的資料進行抽樣,根據統計學來做抽樣,再拿到網路上或者是社群媒體上搜尋,找有沒有相關可以比對的資料,再來確定所計算出來的風險值會不會違背設定,接下來輸出,並作查核驗證。