合作的方式是大家都要先建立共識,先同意,可是我們知道到20個人都會出現階層,因為不可能每個人都很熟每個人,到150個人就再也不可能合作了,這是人類的限制。
為什麼萌典能做這麼多呢?並不是因為我這麼厲害,懂這麼多種語言。我完全不懂阿美語。重點是做阿美語的那個團隊根本不用問過我,因為我們採取的是協作的方式,而不是合作的方式。
我有經常參加的長期專案就是萌典。萌典有非常多國語兩岸辭典,民間捐出來的國語、台語(閩南語、客家語、阿美語),上個月藏語都進來了,基本上臺灣有人在使用的語言我們都會收錄。
我記得這是第一次在24小時之後,就獲得了衛星地圖上捐出來的震後圖資,這樣就可以把震後的也標出來,這樣的話紅十字會、聯合國進去的時候能走哪一條、不能走哪一條路,以及最重要的就是災民自己設置的帳棚在哪裡。
這是八仙塵爆時所有急診室推床的狀況,這是當時臺北資訊局提供的資料。塵爆的時候是在周末,人不在,所以g0v的朋友就可以自己做這樣的系統,也做各地血庫存量的系統。尼泊爾救災的時候也有,當時是把衛星圖切成一小塊一小塊,同樣每個人只需要貢獻一點點時間就可以把那塊的道路和建築物標出來。
所謂『誰在乎誰痛苦』,所以他就很痛苦,他一整天如果不把它做得更好一點的話什麼事都不用做,後來他就把它做得比較漂亮。後來我們發現在手機上、平板電腦上看起來沒有辨識度,那個紅點太小了,後來又改良,可是如果不是一開始有人不怕丟臉,就不會一張圖惹怒設計師,把更好的創意引發出來。
舉一個最簡單的例子,零時政府一開始的兩位發起人是特別會寫程式,但是特別不會做logo的,他們做的logo超醜,可是他們不怕丟臉,就把這樣超醜的logo掛著,有一位設計師就來了,他說看著這個logo全身不舒服。
我很喜歡的一個歌手的一句話,『萬事萬物都有缺口,缺口就是光的入口』。所有的事情都有不完美的地方,這樣別人才有參加的動力。
那為什麼叫做坑,而不叫做專案呢?因為我們不要有專案經理人、專案代表人的頭銜,我們就是挖坑、填坑的,它完全沒有上下階級。坑的另外一個意思就是說,一切東西都有不完美的東西,我們先面對,現承認那個不完美的東西。
因為是開源的關係,所以你填到一半跑掉也不會良心不安,接下來的人不用問你,也可以做下去。在這樣的前提下就是一個迴圈,你加入黑客松可以認識很多坑,你加入坑之後會認識更多人,他們會把推到各種松,你又認識更多坑,這就是一個零的迴圈。
昨天有20多個提案,每個提案人上來挖一個坑,說有些事情需要做,好比開放政治現金,然後需要什麼樣專長的人,比如需要兩個法律工作者、兩個文字工作者、兩個設計師等等,然後就組隊,最後就會發表,通常就會約每兩個禮拜做下去。g0v並不是一個一般意義上的團體或者組織,因為挖坑的人不能強迫別人來填坑,他填坑也不受坑主的指揮,很多坑主挖完就跑了,所以每個人都是自己要做什麼就做什麼。
今天跟昨天,都是兩個月一次的大型黑客松,幾百個人,有很多東西吃,進來的人自己拿一個自己的專長貼紙,可以貼在自己的肩膀上面,第一次來的人有梅花鹿,來很多次的人有黑熊。這個東西要做什麼呢?重點就是要提案。
反過來講,如果是在北韓或者在中華人民共和國,或者在一些中東國家,我們不要說12萬人,我們聚集到12個人就被請去喝茶了。所以你需要有一個卡在影印機時代的政府,跟一個蓬勃自由的公民系統,這樣才能作出像開放政治獻金這樣的事情來。
高嘉良去開會的時候,全世界20幾個國家做civic tech的人聚在一起,他們統計了一下,看起來以色列跟臺灣是最活躍的,臺灣的規模又是以色列的10倍,所以高嘉良就說我們不出國比賽不知道自己第一名。可是這個第一名並不是那麼值得驕傲,如果是在英國或者美國,他們的陽光法案,本來監察院這些資料就是公開的,不需要花那麼多力氣去做這些事情。
最後就是我們自由軟體的人,我們欠缺的就是公民精神,我們平常其實真的沒有那麼關心這些事情。g0v就是把這三種人結合在同一個空間,讓大家彼此學習到彼此的優點,這樣就可以作出這三方單一都沒有辦法做出來的事情。現在有很多臉書的訂閱,有很多透明公開的專案的共筆。
g0v提供一個空間,結合社運團體,好比剛才說的核456,他們持續進去把東西印出來,他們不習慣的是什麼?是分身伐樹,他們很習慣的是十個人,然後可能花一整年,把東西都打成資料,並不習慣把它切出去拿給幾萬個陌生人一起協作,所以這是開源模式。
這樣的模式是g0v一直以來運行的模式,本來群眾媒體,像張大春或者是馮光遠,他們個人都非常有影響力,臉書隨便上發一個文就有幾百個贊,但是他們並沒有行動主義的感受。像馮光遠好了,他為什麼用比較cynical文筆來寫東西?很大一部分是因為他覺得,他寫的東西不能真的改變什麼,這樣的話就會有一種無力感。
當然,我們也可以看到有些政黨特別艱困的選區,需要許多的競選經費,民進黨也有,中間紅色的顏清標委員不太需要政黨,自己有很多的選舉經費,可以做一些比較。
好比在11/29投票的時候g0v的朋友們找到了各地的市徽,就有人說按進去發現22個候選人,我看完了補助記錄、出席記錄、投票記錄之後就只需要從兩個人選,所以這對民主的深化是有幫助的。
結構化資料可以做什麼?在座的各位比我都知道可以拿來什麼,我們只能做一些很基本的,比如說顯示。這裡沒有針對特定委員的意思,但是我們可以知道他的政治現金從哪裡來,花到哪裡去,如果他是議員的話,跟他的補助款的公司之間有什麼關聯。
所以大家都在臉書上分享,一大堆人跳出來,24小時就把它變成了結構化資料。
所以我們就把它遊戲化,變成一個數位化的網站,在上面說現在有40萬筆,每次資料包上線的時候就會有更多筆輸入。有玩過開心農場的人就知道,人類是一種很奇怪的動物,你只要看到一個數字一直跑,即使不睡覺都會想把它跑到0,只要有一個進度條,不睡覺都要跑到滿。
g0v有一個最主要的概念,就是分身伐樹的概念。我們如果把它切成低於1分鐘,每個人只要花10秒鐘就可以做貢獻,那麼他們花的時間就跟有一個評論、有一個分享、有一個讚差不多,而且他們能夠獲得心理上的快樂是勝過在臉書上發文章的,這樣的話就可以把臉書上的人吸引過來,主動變成資料的貢獻者跟提供者。
那為什麼能夠這樣呢?像馮光遠當然不可能自己跑到監察院印幾百頁資料出來,所以確實是有NGO、核456的朋友們跑進去。他們印出來之後就是這樣一張A4紙,我試過要這樣key大概要3分鐘到5分鐘,如果號召大家來捐3分鐘或者5分鐘,根本不會有人來。
專案裡有NGO、工程師可能不到四成,還有設計師,還有做文案的,很多資料包。在這裡『豆腐』的意思就是被切成一塊一塊。第一批印出來的資料大概30萬筆,號召了9700多人參與在24小時之內,每一格有三個人以上看過,這個就是所謂的宅力文字辨識 Otaku Character Recognition,大家宅在家裡沒有事的時候就花一點點時間。
當然,立法委員是最會被這個開放影響的,所以他們排案可能排到最後一案,不審這個修正案。所以怎麼辦?就有一位馮光遠,是一位國寶級的白目,他除了跟計程車司機吵架之外,也會提很多很有趣的主意。他挖了一個坑,我們用一個太陽與北風的戰略,實際去監察院印資料,然後把它拿出來、把它轉成結構化資料。監察院一定會跳出來,說怎麼能保證資料百分百正確呢,這個時候我們就可以說『好啊,你們改一下查閱辦法,你們自己去釋出百分百正確的資料』。
可是你說這是因為監察院黑箱嗎?也不是,而是因為定那個想法的那些人,本來就是卡在影印機時代的人,並沒有想到這些資料放出來是有更多的價值、應用。
玩臉書的時候大家都很懶,都只有1分鐘。如果用一句話來形容零時政府g0v,它就是一個讓大家又懶,又可以參與的真正的行動的實踐。舉一個例子,監察院的政治獻金,資料只有他們自己有,提供給民間的只有影印出來的資訊,也就是說只有監察人才能做監察,人民只能幫他做覆核。
接下來很快速地跟大家介紹一下在g0v這兩年多來,怎麼樣做Crowdsoursing,怎麼樣做眾包。2013年春Wired訪問張大春,張大春喜歡玩『臉書』,也很關心政治,然後外界問說臉書能不能影響政治,他回答『絕對不會。它會讓公民以為自己參與,好象真的有做什麼事,但是事實上並沒有改變,想不出來一個讓大家真正參與行動的實踐』。
最近跟我長期合作的呂家華,他說『技術者背後不會也不該只有技術,每個技術背後有它追求的價值』。我跟家華說我的價值在1994年開始就非常穩定了,就是持守這個價值。
我從全球資訊網得到那麼多,我也想給回一些東西,所以說我剛才的一個想法就是促進一個安全的空間,這裡隔著螢幕不會有剝奪彼此發言權的狀況,大家可以互相學習,一步一步朝向實際可行的想法或者實際可行的理念,把它實現出來。
我是1993年回臺灣的,我從一年級以後就沒有再去學校,為什麼?因為1994年發生了一件人類歷史上很重大的事情,就是全球資訊網的發明,我發現我在上面可以接觸到所有尖端的研究,而且不需要等十年時間編成教科書,就可以接觸到目前關心的事情發展到怎麼樣。
因為我爸的博士論文是做天安門學運裡面的人際關係研究,所以到德國,然後把當時流亡在德法的中國名人士結合起來,試著去做深入的訪談跟研究。我陪著他去念博士,所以整天在客廳聽到的就是要民主化,要對話,讓整件事情不要有那麼悲慘的結局。
在我開始寫程式的時候我爸剛好在天安門,他是從5月採訪到6月1號,我們知道沒幾天就發生天安門事件,因為這樣的關係所以他對學生運動起了非常大的興趣,1989年年底去了柏林,當時有一個柏林圍牆倒塌的事件。當時東德警方沒有開槍,很多人都覺得是因為已經發生了6月那件事情,他們不想要重蹈覆轍,當然1990年臺灣野百合,也都會有類似的想法。
為什麼我會想要做這些事情?我自己開始寫程式是1989年的事情,當時我8歲。
既然司法院也是逐字稿,立法院也是逐字稿,為什麼國教院不能是逐字稿?這是我的基本想法。經過三次討論以後,也很感謝20位出席的委員全部同意,所以從今天開始如果各位到archive.tw的話,就可以看到之前三次跟之後所有的國教院的逐字稿。
其實g0v本來另外就有一個專案,就是零時政府立法院,ly.g0v.tw就可以到零時政府的立法院,它顯示的東西跟這邊的政府是一樣的,只是說比較視覺化,比較容易,每一個法條好像購物車:到什麼程度,甚至它給的每個字,你可以把那個東西的超鏈結分享出來,我們就可以就法案的修正做討論。
剛才有聽到我在課發會剛擔任委員,開了三次會。我主要做的事情就是希望能夠建立一個系統,把所有課發會每個人講的話,還有照片都公開,這樣的話每個人每個時候講了什麼話可以成功地呈現在全民的面前。
我的第二個部分,就是Data Governance,會講到跟臺灣的國發會合作。
Socialtext,就是我2013年賣掉的那個公司,是把Facebook試著賣到各大政府和各大企業裡面。萌典是g0v的,我待會兒介紹,目前正在跟牛津大學合作。
誰也不能命令誰,也不是通過金錢交換的方式,每個人自願地去填坑,用這樣的方式就可以跟公部門、私部門有各種不同程度的合作。以私部門而言,我這5年來在跟蘋果合作做Siri的案子,所以看到資料的時候腦裡想到的都不是數字,都是文字,因為其實我們處理的東西全部都是自然語言,而且是雙向的東西。
我是1994年出社會的,工作了20年,2013年退休了,退休之後就沒事做,跟一般退休人士一樣做志願性質的事情。我退休之後才發現,臺灣的第三部門有別於由上而下各個科層的公部門,跟以市場機制為交換的私部門,每個人自動自發願意捐一點時間、捐一點力氣出來,這種志願部門非常強大。
我們在這裡黑客松的時候,通常都會用三個關鍵字來介紹自己:開源、公民、黑客。開源的意思是部分或者全部地拋棄掉著作權讓其他人利用,公民的意思是關心這個社會,黑客的意思就是用有創造力的方式解決問題(當然不一定是不合法的)。
第一部分的主題要討論的就是Crowdsoursing(眾包),怎麼樣說服許許多多的人,一起來願意提供資料,讓後續的利用者使用?
先請大家想一想,『資料開放:被動開放』跟『開放資料:主動開放資料』是兩件不同的事情。
但是你如果把它調換起來,一開始請使用者說做這件事情就是為了要累積資料,就是為了要把資料開放出來,這樣你就完全沒有後續利用的問題,這叫做主動公開。
所謂的『開放^資料』,很多人是想先取得資料,這些資料本來不是為了開放而取得的,它是目的外之利用,然後政府再把它開放出來,可是這樣就有很多問題,包含個資的問題、目的外之利用的問題,當初被搜集的人其實不一定為了取樣,他們也不一定是主動的,你也許還要取得他們的同意,等等。
這是最近發生的一個例子,我們國家教育研究院課程發展委員會,我現在是課發會的委員,我們開會的時候聽到吳部長說『學生要求會上的發言都被公開,這樣委員就沒有辦法放心』,在他講這句話的時候我正在會場跟其他委員說把『被』字去掉,主動公開,大家就可以放心了。
當時昇瑋要我講的時候,本來是『開放×資料』,各位議程上還可以看到,我後來想一想,乘法左右兩邊對調是一樣的,但是資料開放跟開放資料是完全不一樣的兩個概念,所以就換成了『開放^資料』。
今天的演講結構大概是這樣,我會分兩個部分,一個部分講Open Data ,另一個部分講Data Governance,兩個部分加起來大概講35分鐘,最多40分鐘,最後留10分鐘左右的時間問答。我的演講一般來講都會被認為講得特別快,所以如果有聽不清楚或者想討論的也歡迎隨時打斷我,然後我們就講的內容去討論。