我們來計算重新識別的可能性:重現性。這樣的定義是假設在資料接收者的團隊如果剛好認識資料集所指稱的資料當中,我們放出了100人,可能其中認識5人,直接猜到5人的機率是5%,可能不變的話,權重就會比較高,如果不變的話,就會降低。在這個案例當中母體資料數很大,以一個人的鄧巴數為150左右,我們換算下來的重現性相當低,因此這在後續處理當中是一個決定性的作用。