有啊!會三欄的。
為什麼要這樣做?因為我們想要把裡面每項公告時的文件,全部都轉成結構化資料,來放進公共參與平台裡面的「眾開講」這區裡面,每天會上十個、二十個這一種公告進去,這中間的界接,當然是透過開放資料。
另外一個是,並沒有一個有系統的方式,把它加上一個部會的標籤,然後去界接到一般人民可得的開放資料集裡面。這一個工作,我們具體會在明年大概2月的時候,透過行政院國發會開放資料平台,把這上面所有這些看到的資料,都轉換成「data.gov」上的開放資料集。
所以現在的問題有兩個:一個是使用PDF格式,它的結構性可能有待加強,但至少不是圖形檔,我們目前看到的通常都是文字檔。
這個資料屬於公報資料,所以是不可能主張著作權的東西。
所以當他最後通過,也就是六十天過了以後,它會有一個「自即日生效」的PDF在這邊出現,但是在這個生效的時候,你回推六十天,還會看到另外一個公告、預告修正的同樣一個格式、名稱的東西在這裡,所以從前六十天前的跟六十天後的這兩個部分,在這裡一定有資料的。
在我上任之前,9月的時候,行政院本來就已經把所有的法規修正的預告期間,從十四天改成六十天。
對。
這個時候就要看沒有人知道的系統。我們不斷給大家看沒有人知道的系統...
其實這個是有的。
修訂紀錄在我剛剛展示的那個API裡是有的,應該是去另外一個系統拿,像是立法院議案文書。
在資料格式這一部分是沒有問題的,但在授權裡面,是不是一下子就要全部開放到CC BY的寬容式授權?這在各國都還有爭議。我們在中央各部會裡面,目前並沒有形成非常統一的見解。
當然「相同方式分享」跟「禁止商業利用」又不一樣,但也有人說希望禁止商業利用。也就是說,本來CC授權架構裡面,就包含了對資料六種不同的想像。
以法國為例,他們所適用的授權會兩個併行,想要鼓勵產業的才會去用寬容式授權,如果不是想要鼓勵產業的就會加以限制,限制條款裡面就包含比較像「相同方式分享」的東西,如果拿它做了應用、對資料的改做,跟它相混合的資料也必須都要用相同方式分享,也是有這樣一派的想法存在。
但其實在國際上,對於資料的授權,是有完全不同想法的流派存在。目前所通過的國家資料的授權條款,它是屬於寬容式授權(permissive license)。這個意思是,你既可以做社會上的運用,也可以做商業上的利用。
不管是國際上政府對政府,或是任何國際的協約,要作資料交換,都是這樣子做。
「以兩個以上開放源碼軟體可以讀取的格式」,這是國際上對於開放格式的定義。這一個定義我們已經有政治意志,可以說所有的機關之間互相界接,應該要不用專屬軟體就可以開啟,而且必須要機器可讀、可以處理,這部分是沒有問題的。
我必須跟各位朋友做個期待管理。
以上只是舉例,我並沒有要介入個案的意思。
在提出一個恰當能回應社會問題理由的時候,我們就可以用那一個理由,專案去跟法務部討論,這也沒有問題。
但是我覺得,除了用正規開放資料諮詢小組的程序之外,就回到我們剛才說「資料是要為開放政府服務」。如果從民間的角度,能夠去看說現在有某顆未爆彈或某顆地雷,需要有這樣子開放授權的東西,我們才能把法務部的草案,好比說是關於民法家屬的部分,用機器自動做成懶人包...(註:這只是舉例而已)。
當然我們現在也理解,未來不一定三個月開一次,說不定半年才開一次,我們剛剛才講過這件事。因此處理的週期比起以前長,可能沒有辦法用一種隨時檢討的方式來處理。
應該這樣子講。我們剛剛才開過的院級開放資料諮詢小組會議,仍然可以建請特定部會在他們的開放資料諮詢小組裡面,去討論這個事項。
當然,廠商必然還是會有廠商提出的要求,只是至少從完全不懂資料格式的高層管理人員來看,至少這是兩個可以相提並論的東西,並不是一邊是空想,另一邊是現有的系統。
現在的做法程序,仍然是承續我們在g0v的做法。如果我們已經可以證明用這個API,可以提供跟這個相等程度的服務,為什麼機關下一次改版或重新採購的時候,不用這個方式來具體釋出?這個方向跟路線,與我們以前在g0v是一樣的。
我們一向都有「拆政府原地重建」的想法。當初教育部的字典也沒有API,當時是葉平所設計的,這也不是假的,而是我們抓下來之後,實際按照葉平所設計的API去提供服務。
它不是假的,是事實上民間自己爬了資料去使用的。
現在至少開放格式可以先談好,然後去談授權的時候,就可以說:「請不要再用開放格式作為理由,格式已經準備好在那邊了。」授權只要一簽定、次長一同意,資料就再也不可以撤回了,也不會因為換了廠商,所以莫名其妙就被撤回。這個是通案性的原則,跟大家討論。
在以前常常會碰到的是,跟他談好開放授權,但他說他的廠商無法支援開放格式。你跟他談好開放格式,而他說因為限於什麼原因,不太容易開放授權。
當然民間的朋友很快發現,原來有這樣的一個地方,所以確實也有朋友馬上把法規列表、單一法規的所有修法版本列表,所有這些都用機器可讀的方式,提議了一個API進來,我們未來才能拿這個跟法務部談說:「請問有什麼原因,你不能把你的資料用這樣格式、用開放的授權進行?」
如果未來有更改的話,也必須要公告、通知,那就不是放在網頁上好看,而是會變成具體往民間的承諾之一,這樣一來,要改授權跟改格式這兩個都要經過正當程序:改授權要次長同意,改格式必須跟進行檢核的機關解釋。
第一個描述的,當然是國發會自己的「共通性資料存取應用程式介面API」,也就是「data.gov」自己界接用的的API。當我們把它寫出描述後,我們會說服該管的機關在這裡是國發會的資管處,直接把 YAML 檔放到「data.gov.tw」底下,也就是說它變成網站的一部分,受網站的使用條款規範。
再講最後一個,目前PDIS小組會做的另外一件事是,我們會把現有甲類,目前以JSON-LD或者是一般JSON所開放出來的API,用機器可讀的方式去作描述。
今天有另外一個具體的決議是,把後面的要點具體加上「開放授權」這四個字。這樣的話,至少未來在進行開放的時候,就必須要以開放授權為主,如果不行的話,必須要出具理由,我覺得這也是具體的進度。
第二個回應是,原本在擬資料開放要點的時候,因為上一版的要點,把甲類資料跟乙類資料有一點混在一起,沒有寫「開放授權」這四個字,而是寫了「開放格式」這四個字。所以在進行適用的時候,如果是按照資料分類原則,就知道要「開放授權」;但如果按照資料開放要點的話,因為開放授權沒有寫,他可以說沒有看到。
我想往者已矣,沒有辦法回溯適用今天所講的精神,去法務部的個案。但是反過來講,我們確實應該要再去檢討為什麼之前做了這樣的判定,有沒有可能回到本來標準的開放資料授權去?這是第一個回應。
這個理由必須要上升到二級機關,包括開放諮詢小組委員會、資訊長或者是副首長,那一個副首長必須批示這樣的轉換確實是符合公共利益,才能再做這樣的切換。
必須有相當好的理由,才可以把甲類資料轉為乙類資料或者是把甲類資料下架,這在我們今天上午的討論有一個具體的結論,我覺得這一個結論相當重要:我們每一次在做這樣資料判斷的時候,首先必須要先出具這樣的理由。
我們在討論那一個分類的時候有一個精神,就是一旦分為甲類之後儘量不要切換,除非有非常好的理由,告訴大家說這個資料釋出,於公益上面不再具有公益,或者是侵犯到第三人的個資隱私或者商業秘密。
確實本來在開放資料的要點裡面,本來機關就有把甲類資料跟乙類資料,直接互相進行切換的這種可能性存在,所以我們並不能說法務部這樣做是違法的,他也沒有違反那一個要點。
是的,我這邊先做一個具體政策上的回應。
多年期的計畫具體來講,就是昨天啟動的「數位國家・創新經濟」方案,所以高嘉良的一些提問,我會使用「數位國家・創新經濟」方案裡面的路徑圖來回答。
我覺得本來開放資料用來跟人民溝通、解決問題,並不是一件壞事。現在的問題常常是浮現到後期、非得處理不可,好比有某部機組要啟用或停用,或者是跳電,才回過頭來想:「對,開放資料對這個非常有幫助」,而不是長期、多年期的計畫說:「我現在就知道三年之後要做這個,所以現在要準備開放資料來揭露。」
另外一個也很同意的是,確實目前為止這一任的政府看起來,因為上一任政府把最基本的資料都已經開放了——也是在要交國際考卷的關係的前提上——因此我們這一任政府,確實目前為止開放資料,看起來都是為了回應民間提出來的一些政治上壓力,或為了要解決問題。
我們協調的會議,以及高嘉良所說對政策的執行等等,其實都放在逐字稿平台;但是我也理解,要求大家都去看逐字稿是不人道的。我們在逐字稿後面,現在大概會具體列出每次的列管項目,但我相信仍然沒有用現在這種對話的方式,就上位方向的討論來得重要,這我非常同意。
我先回應一下花邊新聞這件事,這也是我個人非常困擾的事情。對於各位有訂閱我Wiselike的朋友,已經看到最近連我用什麼牙刷都開始問了,我相信佔用大家許多認知的頻寬,在此向大家表示歉意。
好,沒有問題。
沒錯,公僕的公僕嘛!現在你是我老闆的老闆(笑)。
各位觀眾,大家好(笑)。
開始,請。