“個人資料去識別化程序主要是參考經濟部標準局的制定，判定直接識...”

Speech by 謝明峯

個人資料去識別化程序主要是參考經濟部標準局的制定，判定直接識別欄位，如果有就直接刪除，例如資料做DATA的處理，把直接識別的欄位用一個亂碼來取代，如果沒有重新識別的要求，這樣的欄位其實是沒有意義的，所以就會直接刪除。再來是按照我們的需要來選擇未來所要釋出的欄位，而且要判定這一些欄位哪一些是間接識別，哪一些是不涉及個人的資訊，接下來是進行到風險，我們來算一下這樣的處理要把K設定多少才能滿足風險評鑑的目標。接下來是調整參數，經過處理以後，可以達到K值的紀錄。K值都處理完之後，就會有一個離群值，這邊用5％的個體回應全體50％的支配模式，意思就是如果在二十個人的群體當中，如果有一個人的收入占所有二十人的一半以上，顯然這樣的狀況、這樣的個人很容易被猜出來，如果有這樣特殊狀況的數據就要經過特別的處理。但在我們這一個例子當中，等一下會提到收入是用等分位來處理，所以離群值的狀況不會出現，也不會在這個案例當中發生。接下來是把所有處理完的資料進行抽樣，根據統計學來做抽樣，再拿到網路上或者是社群媒體上搜尋，找有沒有相關可以比對的資料，再來確定所計算出來的風險值會不會違背設定，接下來輸出，並作查核驗證。

2016-02-23 「個資去識別化」諮詢會議

Show context

SayIt

Keyboard shortcuts