就像我剛才說的,要先問:這件事你解決了社會上哪些特定族群的什麼問題?我們才能在政務會議提出來。提出來之後,院長認為真的要解決這個問題、指示人事總處進行辦理,我們才能從政務委員的角度,去幫助院長協調他覺得需要解決的問題。
因為要做紀錄剖析這一件事,它需要的量能跟你拿一個特定、專屬的資料庫,你只是讓它出CSV,需要的資訊人力是不一樣的,可能是十倍以上的量能。要有十倍以上的量能,就必須要有十倍以上的政治意志去支撐。
對,這個結構很適合用區塊鏈來存,但以上不代表政策指示(笑)。
但現在的問題是,這還是需要剛剛所講的紀錄剖析。如果要做剖析的話,需要有個政治意志出來說,我們去清查之前所有的派令,然後衍生出一套穩定的事務紀錄(stable transaction log),而且是只能添加(append-only)的紀錄…
總統府是一個比較特殊的單位,我們沒有辦法直接請求他們去建立任何系統。人事總處以我所知,所有的這些派令他們都有一份複本。
所以當他制定的是通則性政策,要做證據導向討論時,那我們剛剛講的「給予解決社會上特定人民問題的政治壓力」這個渠道比較走不通,我只是想要講這一件事。
我知道(笑),我完全同意。但你講的是不特定人,要放假就是不特定人都要放假,我這邊講的是,像內政部的櫃台,來申請服務的一個人。
這是非常有趣的組織法的狀況了,因為理論上院的處是協助部會去聯絡,所以像人事總處、資安處、教科文處,都沒有開放資料諮詢小組的原因是一樣的,因為理論上他們本身的業務不及於跟第一線人民,去進行資料上的界接或說明。
我完全尊重人事總處的總規劃,相信各界的需求都有收進去,但在他們有一個通盤規劃進來之前,我以政務委員的身份不適合發表意見。
對,我另外一個補充:人事總處目前在2017年度對於整個組織改造,還有包含組織改造前繞過規範的借調、外包、駐點及約聘僱等等,其實正在整理一個通盤的想法,包含大家之前一直很關心的,資訊相關人力或相關人力怎麼配置,或者新科技要不要有專門辦公室等等這些東西。
我也同意這是一個問題。
在沒有界接的情況下,既然沒有主要索引值,那唯一的做法可能是在那一張卡制發的時候,留個副檔上傳到某個空間,但這裡馬上碰到個資法,這條路我覺得比較走不通。
所以那個門禁卡的制發是否有上網,它和講的那一個公告系統或者是任何其他系統有所串接?以我的理解是沒有,但說不定有,只是我還不知道。
這個應該不在剛才的統計裡。因為那個識別證只是能夠進門的意思,並不是忽然有一個員工編號的意思,這個是兩件事。
是的。
如果你把所有公告的自然語言加以剖析的話,想必把調職、復職互相對消之後,就可以得到從使用端這邊目前實際的人數,甚至連人名都會有。但從借調端,從計畫那邊拿的話,我們院裡也沒有這個資料,這個是說實話。
在人事總處,其實每一次有外面機關借調進來的時候,會在行政院內部的系統裡面發一個公告,這個公告是「某某機關的某某人,因為某某原因,從即日起借調到某某單位任職」。但這樣發完之後,其實我從院的內網也沒有看到資料庫去查詢這一件事,這就變成是紀錄剖析(log parsing)的工作。
如果用雙重計畫轉包借調的狀態,那從來源端跟結果端統計,會產生不一樣的數字。
沒錯。
…從明年開始運作的時候提出討論。
我如果沒有記錯的話,高、屏、澎是在一起的,但金、馬因為是不同的省,我相信福建省政府主席,也就是另外一位政務委員,對這件事有裁量權。這不是我的業管範圍,我不會幫景森政委表示任何意見(笑)。
未來這個工作,就會落到六都的列管範圍裡面,所以這一都就要負責,跟旁邊各縣市至少回來的資料欄位要統一。這件事我們期待台北、台中,以及以我所知其他都,慢慢都有開始比較懂資料的朋友進入一級協調的情勢下——這個要用非常和緩的方法講,不能講成組改——我相信六都慢慢都會開始有這一個量能,去協助附近的行政。
之前的問題是,不管是國發會的管考處,或者以前的NICI,沒辦法下到這些地方縣市去協作。像我前兩天才去澎湖,其實我沒有辦法每天跑這些地方,跟他們的資訊中心進行協調。
有時院級往所有的縣市進行某個資料普查,通常會交一些試算表上來,欄位的名稱不一樣就算了,好不容易弄到一樣,也可能比較有資訊量能的那些回來的資料很詳細,但比較沒有資訊量能的縣市,就可能出現明明從網頁上看起來就有三十五筆,但回報回來只有三筆的情況。
當然我們也瞭解到資訊系統絕對不可能馬上整併,但至少可以做到格式一致。
六都在DIGI+裡面,每個都要認領他們附近的非六都縣市。
如果真的沒有問題的話,在下一次上層推動小組開會的時候,就會解除管考,這是跟地方協作的具體做法。
當郭執秘知道一件事的存在和重要性之後,他會回去科技會報,也就是DIGI+的協調分組。協調分組在這邊,並不只是每半年或每三個月一期的管考,而是直接跟中央、地方開會,然後盡可能把這件事解決掉。在解決之後,也會提回到當初所提出分組的副執行秘書,請這諮詢委員進來,來確認這個地方真的有協調掉。
當數位國家分組發現這個議題的時候,是可以透過民間諮詢委員對這一件事的提醒,到上面的推動小組,讓六都副市長知道存在這一件事,並且希望在下一次數位國家聚會時列入管考,或用某種方式向科技會報辦公室的執行秘書,對這件事進行報告。
這個編列的架構,跟之前NICI的架構,有一個非常大的不同,也就是六都的副首長是DIGI+上層推動小組的委員。在每個具體的分組裡面,好比像高嘉良講到的事情,它可能比較屬於數位國家分組,包含智慧城鄉、數位政府,乃至於網路社會這些事情。當然這件事比較不需要做資安判斷,但是如果有資安判斷的話,院資安處也是要進來的。
這兩件不完全重疊的事情,在行政院級會有一個推動小組,接下來在四個不同的單位會負責四個推動的分組,另外還有一個民間諮詢委員會,民間諮詢委員會的召集人會上升到上面的推動小組,但是副執行秘書會去管底下這四個的建設分組。
有的。目前處理的方法,是在「數位國家・創新經濟」方案裡。
我是協助督導資管處,但我一般不會微距管理(micro-manage)到這個程度。但如果他們中間碰到任何問題,都可以來找我幫忙。
當然啊!我的意思是說,其實人工抽查一段時間之後,某些試誤規則(heuristics)其實可以寫成半自動化的程式。一定沒有問題的就放過,看起來有問題的用人工複查,這都是屬於資管處的權限。
是,至少抽查結果的柱狀圖一定是人工做的。
是有抽查。
因此,跟各位朋友在這邊說一聲:我們絕對沒有要把資料下架的意思,只是提醒說你的反查是有問題的。好比說欄位是寫西元年,但資料值用了民國年等等的狀況,這是要一視同仁看待。並不是OID對不上,我們就特別看待,而是說如果寫西元年,但是用民國年,或者是反過來的情況話,我們就是在資料檢核機制裡面,如果有人反應的話限期七天回應,用這種方式去責成處理。
這件事,其實本來國發會就有對「資料欄位不符合資料實際內容」這件事加以檢查,而且檢查下來,我如果沒有記錯的話,初步抽查高達65%的資料集有這樣的問題,因此我們剛才開會的時候才討論說,如果一發現有問題就要下架的話,「data.gov.tw」就會瞬間下降35%的資料量。
但如果我們實際進去清點,發現反查失敗了,例如像把臺灣的「臺」寫成台灣的「台」的話,這就是屬於資料品質不良的部分。
這時,我們其實可以用一個宣示性的方式,去希望只要任何地方用unique key作為primary key,又能夠透過某個開放資料集,往OID完全對應,那麼在開放資料產製的時候就應該要反查OID的欄位,然後一併釋出。
另外你剛剛提到比較大的,有時在系統建置的時候,只用機關的全名,而不用OID當作主要索引(primary key)。或者是用OID,但並不是在全部的地方使用OID,而是用和它關連的某個特定索引(unique key)。
好比像服務對象,如果想要求每個機關都填報其服務對象,這件事應該是回到OID資料庫的維護來做。如果維護另外一個關連式資料集,從OID到服務對象,我想這是比較疊床架屋的做法,最好還是要回到OID的基本資料集。
當然,如果這一個OID編得不夠細,或者是裡面的資料欄位有缺,我們應該是回「data.gov.tw」的標準程序,希望把OID相關資料加以擴充,加上OID所連到的描述性資料,這個是爭議性最小的。
對,不需要用eGov login,你可以直接去「data.gov.tw」裡面拿。
我想首先就是說,在機關的認定、設立上,本來就會有一個OID的編制,這個是由國發會資管處維護,有一個類似於LDAP、不斷更新OID的資料庫。這個資料庫裡面,本來就設立地方、地址、主要聯絡入,所有這些基本資料都在那裡,而且我沒有記錯的話,是公開可得資料。
好,這是非常好的問題。
工程會。
對我來講,最後只要進入「data.gov」,就是一樣意思的東西。具體哪一個部會阻力最小,我們就從阻力最小的那部會去取得。請繼續。
這三套資料同時提供,這個需求是可以去談的。
是。我想我這邊具體可以做的一件事是,除了用三欄之外,也許我可以跟他們說不只是三欄,而是本來的全部、後來的全部及修正的三欄。