
其實 2 月 13 日跟主委報告的時候,那時本來找李次,他剛好去立法院,後來呂署長有來。

如果找正華,那就是產業運用為主了?

他說他是代替李次來,我們原本是這樣的構想,您也知道政委對外講說年底要有。

有說哪一年的年底嗎?(笑)

太好了。(笑)基本構想是這樣子,臺灣的學研界沒有練過這麼大的模型,本身有其意義,國網的 GPU 目前沒有跨很多可以串接。

那 MediaTek 是怎麼練的?

MediaTek 的模型只有 1 billion parameters,然後這個 ChatGPT 是 175 billion parameters,所以那個範圍是差很多的。

所以後來他們是拿 Hugging Face 上的 BLOOM 來練,就不需要這麼多錢?

就是 BLOOM。

所以華碩也是一樣的狀況?


他是用臺灣杉 2 號?

他說是 2 號。因為華碩是台智雲,臺灣杉 2 號有一半是切給台智雲用。

所以他可以用半個臺灣杉 2 號。


因為正華有請他來作簡報,他說他們用臺灣杉 2 號,把 BLOOM 整套都訓練起來。



現在我的構想是,國網本身也 operate 半個臺灣杉 2 號,所以整個構想就除了學研界—像李宏毅老師就做了 Reinforcement Learning、所謂 AI 李白的蔡宗翰—那幾個開始在用,計算資源是希望來自於國網,我們的企圖是整個 GPT 3,但是要放臺灣的語料庫。

就是專門做 RLHF 這一端,去教化它三個月?

對,然後所有的資料都是用臺灣的語料庫。當然你要去講接下來做完要怎麼做應用,我們的想法是邀請數位部,因為想說可以將整個政府對民眾的服務、數位助手、數位助理就用 Chat Bot 的形式。
(使用白板)

所以聽起來是兩個部分,一個部分不是從頭訓練,一樣是拿 BLOOM 來?

對,那些既有的。

像中研院那個⋯⋯

其實跟聯發科合作的,他們當時也是只有用 6 片的 GPU,中研院、國教院、聯發科⋯⋯Size 也是小的。

所以這個跟之前聽到華碩的那個 BLOOM 是不同的?


現在沒有偏好是要用哪一個?


就是 BLOOM 系統的?

對。我們偏好是要更大,像 GPT 3,也就是 175 個 billion 的 size。

然後接下來?

是用臺灣的資料。

175b,但都是臺灣的資料?

對。資料上有網頁資料,維基百科的資料等等各式各樣的資料,有中文的。

維基百科上面的編輯者⋯⋯

基本上就是繁體中文。

所以簡轉繁的不算?


因為維基百科上很多是簡體打進去,只是我們看到的是自動轉換的正體中文。

就是要稍微篩選一下,因為這個功能我們定位成未來政府對民眾溝通的數位助手,還希望做到英翻中、中翻英文字編輯的。

「2030 雙語政策」?

其實吳政委的想法,世界各地的孔子學院慢慢撤出,臺灣怎麼樣去填補那一塊的需求,像中英翻譯、文字編修,因為現在用它來寫推薦信,非常好用。

這個都還是 text domain,那 speech domain 算嗎?


因為大部分孔子學院也會把 speech domain 教進去。

反正我們有李宏毅的 speech to text 跟 text to speech 這些事情⋯⋯

對,因為翻譯很難只做 text。

我跟部長說明一下,這分幾個階段,第一個,我們希望在 6 月有一個這種核心的 model 出來,今天來跟您請教也是希望怎麼樣擴大社群參與,他們把這些核心的程式放到 GitHub 上的時候,下面的應用社群就可以進來用,比方在 6 月核心程式出來,然後 8 月創造出⋯⋯我講很快,因為我知道您都沒有問題。

我們如果有 1,000 個帳號開放給 g0v 這些社群來使用,然後我們那些資料就可以再做一次 Reinforcement learning,然後到 12 月就可以做一些公開的 demo,接下來第三階段就是要把一些道德倫理什麼東西都要放上去。

我們希望數位部扮演的角色是,因為數位部知道對民眾的服務有哪一些需求,因此請數位部幫忙找各部會對話機器人服務、蒐集法規,我們也可以讓這個原型的 prototype 去做一些 domain 的 adaptation,就會產生所謂的垂直應用。

這樣的串接,未來就可以跟金融界輸入自己要的一些規定、平常用的對話資料,然後在這個 prototype 下再做 adaptation,中小企業也可以做類似的事情,我們想說串接這樣的經驗,其實還是希望盡量 open 出去。

當然,很多人會問你這個做出來以後,怎麼樣營運,其實有了以後要做服務,這才是真正貴的地方,但是在第一年跨部會署科發基金,並沒有到後面的操作。

對,科發是上游。

我們只是希望有一些人在訓練 super large 的 model,然後 push 國網有那樣的能量,技術上可以串接手頭上的 GPU 來作服務,然後對民眾說明的時候,我們就說透過數位部⋯⋯我一開始是希望透過部長掌握的數位政府司,知道政府對民間有哪一些溝通上的需求,利用這個 model 來作一些服務。

所以要買新的算力?

沒有,就是用臺灣的。但是其實 2025 年規劃有臺灣杉 5 號,也是 GPU,我其實跟國網中心主任在談一個事情,過去臺灣杉 2 號在買的時候,並沒有需求,並不知道要做什麼,當時我還記得漢銘一直問你,當時我一直講說為什麼買一個帝寶的毛胚屋,我寧可小一點,上面的服務可以做好一點,上面要查一些法規很像是因為採購法的關係。

我們如果有這樣的經驗,在規劃臺灣杉 5 號用途可能會更具體。

收斂到這邊確定已經需要用。但算力不足的部分,用那個去規劃臺灣杉 5 號?

對,就是有一些目標性。

闕次有沒有什麼想法?

沒有,我在聽。

我先問一下,我們都知道它的綜整能力、推理能力,其實以 ChatGPT 來講,因為有全部的 Github,等於用程式語言跟程式的註解當作中介語言,才有這麼好的推理能力,但是我們現在如果以正體字為主,沒有納入全部的 Github 的程式語言,湧現出來的大概就沒有推理、綜整能力?

因為有一個 prompt learning,那個會做,我們不是單純把資料倒進去而已,因為那有一個評分系統,你講綜整的能力,那其實透過那些,那個是我們會做的。

這個是 3 到 6 月就做嗎?還是 6 到 12 月做?

3、9、12 月都是 check point。我早上有給部長那個 slide,9 月份我們希望有 1,000 個帳號讓社群來使用,然後 12 月就是 1 萬個,3 月份可以正式再做一個更大的。

所以簡單來講,到 6 月的時候既不會拒絕不合理的要求,也不一定有什麼⋯⋯

可能會講一些亂七八糟的話。

就有一點像 playground 裡面的 gpt-3.5 一樣?

是。然後就讓 1,000 個社群去使用,你就可以把這些東西變成回饋再作人類的 Reinforcement learning。

我有第二個問題,我們都用 3、6、9 月來當 check point。因為我們知道 3 月中,GPT4 就會釋出了,狀態是它推理能力比一般人力好了,所以我很難想像社群會願意用上一代的東西,因為大概 3 月中之後,所有人都會跑去用 GPT4 了。

因為 3 月那一版 GPT4 是唯一授權給微軟。

我在講的就是這個,就是開 Bing、Windows、Skype 和 Azure 的 API 出來。

現在就開始到處在 sale,就說很多東西是 OpenAI support,然後服務是微軟來做。

我們不如產地直送,直接跟 OpenAI 談還比較快?

他說他不願意授權。

微軟的目標跟 OpenAI Foundation 的目標不一定相同。

微軟禮拜五去科技辦,那時因為蔡志宏主任 host,我直接跟微軟講我們要做的理由是,國內沒有人訓練這麼大的 model,我們的國網沒有做過這麼大的 model,所以我們有這樣的目標,我們不只是要當他的客戶。

他來我們這邊說要合作,他說他們要幫我們爭取,我們說我們可以蒐集問題,因為他們有企業專屬版,他可以很快的⋯⋯因為個人現在 40 個 request 就停,即使付錢,service 的順序也不會排前面,他們說我們可以蒐集問題,他們幫我們蒐集答案。

OpenAI 現在有一個企業專屬方案,只要跟它租一定程度的算力就保證不會當機,也就是微軟現在要推出類似的,但是後面是同一個,也就是 GPT4。現在的差別只是 OpenAI 的是感謝肯亞朋友有做過 RLHF,但是微軟拿去接 Bing 的是另一個版本。

微軟的說法是 OpenAI 做的是實驗室的,他們對於 service 的細部不清楚,但是他們對產品的掌握度很高。

商品化過的。

那天微軟來談的是,OpenAI 給他們專屬授權,所以所謂的 GPT4 事實上是微軟在用,沒有地方用得到。

但是 OpenAI 也不是不可能自己賣,以我所知它的專屬授權是商業用的專屬授權而已,並沒有不能跟學術界合作。我剛剛的 point 是這個⋯⋯

對,就是為何大家願意用舊的。

對,OpenAI 的情況是付錢給肯亞同仁,但是臺灣社群的時薪高過肯亞不少,所以為什麼要免費幫你訓練這個?當到 9 月的時候,我們就假設 Azure 上所有的 modality 都已經是幾乎免費在提供了,因為這個是微軟主要的商業模式。為何 civtech 社群要理我們,這個是我想要問的。

今天我們要建造一個屬於臺灣版的 ChatGPT,我們想要透過參與,只是有時在那邊玩⋯⋯我本來提一個構想是,現在 ChatGPT 4 還沒有出來,我們就說我們每個禮拜結算,如果 submit 最多的,就給你 20 元去 unlimited service。


我說是不是要趕快架一個社群平臺?我們想要做這件事的理由是,現在都還沒有做,所以有這樣的機制,我就蒐集一些民眾去問 ChatGPT 的問題,我 12 月 當我自己去 demo,他們說有自己的橋段,所以答得很好,我說當時收了一大堆東西,我就 random 選,選 ChatGPT 3 回答,這個是台版的回答。

我很希望的是,如果在跨部會的科發基金中切一小塊錢,拜託數位部讓各個政府基層去使用我們的 ChatGPT,因此知道民眾常常問的問題是哪一類,他們又是怎麼答,然後把它蒐集起來,我們一方面也知道民眾會問什麼問題,這個我會在 9 月份開始做。

這就很像 1999。

對,1999 的資料我們怎麼取得。這裡面會涉及到當政府部會對民眾做服務的時候,裡面如果有一些個資的話,可能要有一些去識別化的處理,我覺得數位部在跨部會署科發基金⋯⋯

現在 2 月。所以你的想法如我們談到的 1999,其實以我所知,台北的 1999 之前已經 全面導入 speech to text 了。

這裡面有一點是,一般 1999 是 Q&A,但是我們應該要用 section 的概念,我可能是 5、6 句在服務一個 case。

通常打去也會講好幾輪。

那 1999 可以收回來的話⋯⋯

1999 就是 data governance 的問題了。


假設導入 PETs,讓整個流程都無涉個資的話,你希望用這個 Bootstrap,把 Q&A 裡面 Q 的部分變成 Benchmark,你的意思是這樣子?


然後這個一路到 12 月做 Benchmark?

對。9 月的核心程式應該也有一些能力了,再把一路的東西做校正,12 月可以 demo 除了一般你問它問題、它跟你對話以外,它真的可以替政府服務人民的角色。

我有聽懂。但我的問題還是相同的,你這邊是用有興趣的人幫你訓練,你這邊是用他的工作就是要回答民眾問題,其實是同構,但 1999 這邊是比較有目的性。

因為前面社群的部分是比較發散,後面是比較 focus。

假設我是市政府,我為何不在 3 月的時候去租用 GPT4,不管是微軟賣的或者是 OpenAI 賣的,把我的東西放進去,因為有一套可以計算的,這樣人家 GPT4 連到搜尋引擎,我們 BLOOM 是沒有連網的 GPT3,人家立刻就可以回答問題了,也就是用既有的 knowledge base?

因為以後就被微軟綁死了。

那台北市政府不見得可以⋯⋯

地方政府還是可以買 MS Office,我們主要用 Google Workspace 和 LibreOffice(笑)。

台北市政府花錢沒有關係,很快讓民眾享受這樣的服務,但是控制能力比較低,他對談出來的東西有一些牴觸,或者是不符合法規,可能要重新叫他們客服再修,我們這邊一開始就可以⋯⋯

我覺得要想一下民眾什麼時間點會有什麼感覺。

我們當時講說臺灣要有自己的一套,其實這個很多業界感興趣,除看到聯發科在講,台達電也在講,其實前兩天玉山銀行的數位長說玉山銀行內部為了這個 ChatGPT 做了黑客松,其實我看起來很簡單,一個使用方式是讓使用者輸入的時候,submit 給 ChatGPT 之前,就把玉山的 regulation 附上去,所以就在那邊做。

他的意思也是如果有臺灣的可以用,最後也不用太擔心這個 data 是被怎麼樣。


我也跟部長提一下,這件事我花了一、兩個月,一開始很大的憂心是,當抖音來臺灣的時候,我們沒有辦法跟民眾溝通叫人家不能用,但當你自己有一套百度的 ChatGPT 出來的時候,你可以說有第二個選項可以使用,我們的用詞比較臺灣風格,所以這是另外一層為何臺灣非做不可的原因。

但是百度比起 Bing 的商轉,能量弱很多。

我相信。這個是文化滲透,讓你使用習慣,所以就是從國安上的需求,還是很希望臺灣能夠有這個。

好不容易用 Google Workspace 擺脫了微軟 Office,是不是要再來一次(笑)。

其實他們講的,我那天聽微軟 demo,他們在講 teams 除了做逐字稿,也可以做摘要,action item 都出來,我都很想用。

這個很好賣。目前我們看很多的分析,在微軟已經有優勢的領域,再加這一些東西,你就更難換掉它。但是有些比較沒有這麼優勢領域,也許有機會,像 Adobe,像 Premiere Pro 對 speech 也有著墨,雖然比不上 OpenAI Whisper,但在 video & photo domain 已經有一些人相信 Adobe 了,所以就算 Adobe 的品質稍差,只要有類似的東西,大家還是會繼續用。

因為你剛剛講兩個領域,一個是 text 的 Q&A,但是 1999 很多都是打電話進來的,就是 speech to text to 回應,另外一個是中、英文字編修,因為這兩個有一點不一樣的領域,一個資訊量在 input 跟 output 一樣多,所以這種領域比較沒有幻想的問題,像機器翻譯是比較沒有道德疑慮,要驗測看有沒有翻對是很容易的。但是有沒有答對是比較困難的,因為你只問了一句話,要回應幾個 kilobytes。

所以 Bing 的做法是:我可以回答,但是我給你官網、reference 的東西。

但是這個有要連到哪個搜尋引擎嗎?

目前沒有特別想這件事,第一個問我的問題是,假設給你 2 億,人家已經花了這麼多錢,憑什麼你覺得可以做?

對,因為 Bing 後面有個搜尋引擎。

即使是 ChatGPT,ChatGPT 也燒了非常多錢。


所以我們用 BLOOM 這些來做。第二件事,我們不教你去寫程式、寫數學問題跟講笑話,這並不是期待未來臺灣版 ChatGPT 有的功能,因此我們做的時候會特別列中翻英、英翻中及文字編修跟要點,比大家現在正在玩的 ChatGPT 功能有限縮,但是我們希望做出來的東西,就是未來可能的應用。

我有聽懂,但是這個是資訊量的問題,剛剛的意思是一個 kilobyte 進來、一個 kilobyte 還你,這種領域要拼得過 ChatGPT 滿容易的,只要資料量夠。但是這個進來 100 個 byte,然後你要回 10k 的資料,這個你要拼得過,因為後面沒有 Bing,所以這個是他幫你找來就好了,他只是負責換句話說,我們現在這個就算把換句話說弄到很好,但是也沒有更新的資料,這樣回答光是問他今天幾月幾日就會錯,你知道我的意思嗎?

我知道你的意思。

因為這個是 input 跟 output 不對稱,要產生這麼多的不對稱只有兩個方法,一個是幻想、一個即時去搜尋引擎找,沒有別的做法。

目前 ChatGPT 也是幻想。

對,但是到 Bing 的時候就有比較不幻想的模式了。


這個 tune 過的 modality 一定會變成 default modality 之一。而我們如果後面沒有一個搜尋引擎,我不太確定 1999 要用我們的,因為連日期都會答錯的情況…

後面的搜尋引擎其實臺灣有人做,到底要不要把它綁進來,這也是一個機會。

像 Bing 那邊是每小時都更新快取,所以光貼的 twitter 都可以直接做⋯⋯

因為臺灣兩個搜尋引擎都死掉了。


看你要不要讓它翻轉?要不要弄個台版的引擎?其實有點像是你 search 的 domain ,不用這麼大、且更新快,沒有像 Google、Bing 這麼難。

對,但是這樣體驗又更差。政府不做那就只是給民間做,我們自己做,但是比民間差太多的話,大家感覺就不好了。

其實要弄 search 引擎也不難,現在只是會有 delay,就是這邊的技術,我也沒有把握以臺灣現在的技術可以跟 Bing、Google 來競爭。

我們有沒有可能專注做這種,最好輸出不要比輸入量多的那個領域?

目前真的是專注做,我只是說你做出來這些核心的 model,已經讓國網有這種技術上成長、落地的一些應用,因為畢竟拿政府的錢。政府對民眾服務與溝通的這一塊,你可以支持,有這樣自己的⋯⋯

就很像現在有很多人拿就業金卡來,但是他完全不會講華語,你可以支持他們,使用者所有用到的服務,這些英語使用者都可以用,還有移工作什麼的都可以使用。

對。我找你有兩個目的:第一個是看跨部會署科發基金,數位部是不是願意合提?因為目前的規劃是國科會主提,應該會委給國研院,數位部合提的部分,像做這些 1999、政府法規,讓一些基層的公務人員去玩一下 ChatGPT、蒐集這些比較有目的性與實用情境來切合民眾需求之資料,然後反饋回來,這個是數位部的角色。

我可不可以問實際的問題,多少錢?

給數位部多少錢?

國科會目前是打算提 2 億?

全部是 2 億,如果是數位部,我算大概是 1,500 萬左右。

但是我們有另外一個想提的,就像你剛剛講的, 2024 年出的這個也是兩大塊,governance 對於 AI 在實際情境運用的這個跟稽核,我們也打算要提。

那個就編下年度,現在是要跨部會署提嗎?

現在的困難是,我如果編下年度,但是你這邊 6 月做出來,我還沒有人可以測這個。

其實我在推 AI 2.0 的時候,我特別有講說對 AI 產品的驗測,這個很重要。

總不能說語言模型走到底了,我們還只能測無人載具。

即使是沒有 ChatGPT 這個 issue。

我們目前都是在測無人載具。我的意思是,如果今年國科會要主推這個,數位部今年卻只測無人載具,就沒有 alignment,你知道我的意思嗎?

我知道你的意思,你的意思是這個 AI 驗測實驗室是對任何 AI 的產品,因為先有 regulation,要有一個驗測實驗室,所以這個是不管有沒有 ChatGPT 都要編錢的。

這兩個其實是完全不一樣,我們這邊是無人載具和空間的互動,你剛剛這邊講到的是意識形態滲透的。

對,不能做槍、販毒的這些事。

所以這兩個需要的驗測能量,是完全不一樣的。

是不一樣的。所以那時人家問我 AI 驗測實驗室有很多分支,就像消基會以前是驗食品的,你本來 AI 是很大的領域,但是像無人載具、人臉辨識這些都是不同的選擇。

對,因為我們最近都在做無人載具,但是現在去弄無人載具的,要來驗測語言翻譯品質,那 99%都用不上。

其實這個影響更大。

那我們今年無人載具先等一下?

無人載具不能等,吳政委認為他超前布署,因為開始談無人載具、資安驗測的時候,那時候我們先談,才有故宮南院的無人機案,他才能說有先規劃。

意思是 TTC 的人不能調過來做這個,那就需要額外調度資源。

這有兩塊,一個是紅字寫的 governance、audit,這顯然可以有新的,而且這個是要長期做的。


但是如果以全部 2 億的情況,1,500 萬去蒐集資料,這是比較獨立的。

我理解。但是我的點是,如果 Q 的 bytes 遠小於 A 的 bytes,我們再怎麼蒐集 Q&A,也比不上搜尋引擎,這個是我剛剛的點,我不可能蒐集到 Bing 的資料量,這樣還不如買 Bing 的 API。但是如果買 Bing 的 API,不如連 Azure GPT 一起買了。當你一起買了,這整個計畫就⋯⋯

就不用做了啊!

但是我們很確信 3 月中,OpenAI 和微軟就都會全面發表 GPT 4,所以我們就是要在這個環境當中找一個⋯⋯我還是覺得要找 Q 的資料量大於、等於 A 的這種。

比較有競爭力。

OpenAI 目前是沒有完全支援我們各種國家語言,還有新住民語言的翻譯。

另外,我看到 ChatGPT 3,不管繁體中文、簡體中文,所占的比例只有 0.09%,大部分是英文的。

如果來做 low-resource languages,這樣和 OpenAI 也比較互補。

所以意思是,今天你從這樣的 model,你大量用我們的中文去練,事實上中文是明顯變好,至少 BLOOM 我們已經看得到效果了。

我理解。那個點是在修辭上,就是措詞、用語跟逗點,但是你最在意這個 Prompt Engineering 的部分,這個已經證明是可以跨語文的。就很像我現在跟你講話,其實我腦裡是用英語想,但是我講出來的是華語,目前看起來 ChatGPT 3 跟 4 這一塊很像都是透過 Github 上的程式碼當作中介語言,所以在英語受到的訓練,自動在中文那邊用,這是一個湧現狀態,其實學界也還在研究要怎麼解釋。

多的就蓋過去。

有一點這種感覺。如果我們 focus 在這個,然後找一些不太花錢的來源,你覺得怎麼樣?我舉例:像剛剛講的國教院、中英翻譯,都已經有很大量的資料。

有,我們現在大量在蒐集,其實剛剛提到國網,其實國家實驗研究院有一個科政中心,他們有很多資料,而且他們也很知道如何跟人家談授權,所以 data 那一塊就拜託科政中心,然後算力這一塊就是國網中心,然後 model 的 fine tune 就找李宏毅這些人。再來是這些東西的使用情境。

也有老師做 speech domain?


因為有些語言,像台文是有些書面材料,但是語音資料也滿多的。

前一陣子台大的語料庫是臺灣授權的。

所以如果你要用是可以立刻用?

廖什麼的,另外成大也有一位教授做台語跟中文混雜。

對,還有客語這些。

所以 speech to text 是最好介接,至少這個頁面很多人習慣用講的。

因為這樣就跟 Bing 區分開了,目前跟 Bing 透過 Cortana,除非咬字字正腔圓,不然你剛剛講的 Mixed 台語什麼的,其實他並不理你,也很難想像 3 月就會理你。

他大概不會理你,因為市場太小。

但是剛剛講說 FB 跟 Meta 那一段不用付授權費,也就是不用到 2 億的話,所有的台語使用者應該都很高興,從語言社群的角度來看。



我的疑惑點是推出的時間點,你要解決人民什麼樣的問題,因為最後到立法院的時候是要面對這個問題。

我們就說委員現在直接用台語或者是客家話質詢我,我都聽得懂?

我在智庫簡報的時候,劉世芳在,因為我現在沒有政府角色,我說委員早上問個問題,一堆人要寫談參回覆,現在 ChatGPT 直接回答你了,他就說以後要直接口試。

就會變成說:「你拿來談,你現在用那個來回答我。」

有人講說要推出比現有的更好或者怎麼樣,當然我一開始的想法是⋯⋯

我同意你說臺灣一定要做,我也同意你現在做太空,關鍵的技術要分辨得出來,然後掌握在自己的手上。因為吳政委已經開記者會講了,所以你下半年勢必這個東西會被要求成果是什麼,如果要有一個快速在三個月,也就是年底倒推半年。

我覺得左邊這個(1999 Q&A)不太可能三個月完成。

我對三個月要有結果的這件事,我都說沒有這回事。

吳政委有這樣講?

沒有,吳政委講 12 月,我們就以 2 月 13 日新春記者會為準。

換個角度來看,如果是臺灣不同語言去翻譯或者是 mix,這個會有感,甚至是只要掛上既有的網站或者是 Q&A,這兩個可以做某種程度的結合,但是白板左邊那個其實地方政府的資料庫可能會比我們還多。

百分之百是這樣。

那應該直接找 1999,因為我們數政司沒有辦法叫 1999 拿資料出來。

推跨部會署科發基金的想法是,如果數位部可以參與是很好的,後面不管是要做 governance、audit 都很容易串接。

如果在 12 月前驗測不進場的話,那就又出現不能控制他打什麼問題進去,第一天就說發現太陽系外行星的望遠鏡是什麼,然後就市值下滑。政府是沒有市值,可能就是民調下滑。

這個是另外一件事,也就是說,其實到年底我覺得一般民眾對這整個事情的期待並不是像現在這麼誇張了,從專家的角度,我根本不覺得 Google 拿出來的是 Big deal,事實上 ChatGPT 錯得更多。

當然,因為 frame 成跟你閒聊的樣子,不是搜尋引擎,要做期待管理。

民眾的想法不是這樣子。

比方現在一堆人無聊問說「唐鳳是誰?」那絕對不會對嘛!我說這個是「不正確使用」,不要說「不正當使用」。

但是,會有這樣民眾教育學習的過程,所以大家對於 ChatGPT 的期待,就會慢慢變成比較合理的範圍。

我舉一個例子,像剛出來的時候,問 ChatGPT 說「一個女人懷胎 9 月生的小孩,9 個女人多久生個小孩。」

後來它數學就變好了,也就是解決運算的問題。

這種就不在我們要做臺灣版 ChatGPT 的範圍內。

但是現在縱算是 2 月,GPT4 還沒有出來,Bing 現在已經會說「我們這個話題到此為止」,所以這就是告訴使用者說,這個談話到沒有辦法回答,而且是到幻想的範圍內。

所以我投影片當中有一塊是注入道德。

但是如果注入道德這一段不做驗測,然後 12 月先來 public demo 說數位部明年負責驗測它,然後結果是 12 月 demo 時要先提醒自己不要問哪一個問題,但是當時會拒絕不恰當問題的微軟 Bing 已經運行 9 個月,我們到時候看起來不是更糟嗎?我的 point 是這個。

所以這個答案會是什麼?

我們的點是,我們是不是挑有信心的領域來做?我剛剛一直強調的是,只要你進來的 bits 大於等於出去的 bits,我們就有信心做驗測,但是進來的只要小於出去的 bits,我們就沒有信心做驗測。

另外一個角度是,我們要做什麼是有用的,假設有一個 general model,我們要怎麼樣落地,是政府可以派得上用場的?

像我有跟 Digital India 的執行長聊,他們很清楚沒有錢請翻譯員的印度另外 24 種語言,叫他接電話翻譯,他認為就算偶爾翻錯,也比這些人沒有辦法接取到政府的服務好,好比他沒有想說要跟 1999 合作,因為他覺得那個是關乎正確性的部分。

我今天來跟部長談的有多重目的。我如果只是來請數位部當作末端使用者,你告訴我怎麼做就好了,但是你本身很會做這些事。

我現在的狀態是,因為你沒有辦法禁止社群也好、大公司也好去用微軟,而且微軟現在就是在搶 Google 反應不及的時間,所以會幾乎不收錢。

只要引擎多 10% 使用他就贏了。

對,所以在這一段當中,人家甚至是付錢請你用的情況。我們如果要做完全相同的事,有點逆風,我的意思是這樣。

但是像剛剛講的 mixed 語言,在臺灣的臺語社群、客語社群、原住民族語,甚至還可以擴大到移工社群,他們很願意訓練,因為這個是有關文化存續的問題,這個不管是文化部、教育部、原民會、客委會都有經費,就不需要我們這邊講說要多少錢。

現在是這兩個議題,最主要是核心的 model,然後找不管是 1999 也好、數位政府司,這只是告訴大家說可以這樣用。

我知道。但是如果出來是翻譯的 model,我們這邊多元司、產業署都可以幫忙。

你剛剛談的是文化部、教育部這些,其實我的投影片寫相關部會是數位部跟教育部,大家在想說這一套出來以後教育怎麼改變。

但是資科司你有瞭解嗎?

其實吳政委的意思是要趕快,我想說下個禮拜或者是 3 月 10 日以前要送一份跨部會署的計畫出去時,我最單純的是讓國科會去提,這樣是最單純的。

對,就是做個 model,反正一定有研究的成果。

如果數位部這邊有一些像法規的東西,像常見的 Q&A 的東西進來的話⋯⋯

我具體建議是,我們 support 這兩塊的部分,也就是驗測跟幫你找這種 mixed speech 的應用情境。

政府回答人民問題?

除非輸入的資料量大過回答,那樣才能做,如果問題的量比較少,我就沒有辦法。

像這種往往想問什麼都問不清楚,是慢慢引導才知道。

對,但是我現在滿確定到 3 月中之後,我如果是地方政府,一定接現成的,很難想像他們會有別的做法。

所以我這樣說,如果這 2 億國科會獨立做,數位部自己來提 governance、audit,你覺得更適合?

也可以,我們就提驗測,申請跨部會署,是不是?也可以。

我現在是李教授。

因為你剛剛說,我們不能移 TTC 無人載具的資源來做這個(笑)?

我沒有說不行,我只是個教授,而教授覺得無人機很重要,所以不能搶無人機的資源(笑)。

這我也完全同意,因為無人機驗測的人來做這個,其實不 work,這應該要一組新的人。

要放在資安院或者是產業署?

你覺得呢?產業署也可以找資安院做,但是概念會不一樣,如果找資安院做,主要就是安全性。

其實資安院的空間是還可以再增加人,如果有個 mission,可以根據 mission 找具備能力的人做。

可能要掛資安院,一開始不可以太發散。

這個也要叫「訊息防護」嗎?

這個叫 AI security。

這真的有一個好處,大家在印象上就立刻從技服轉向資安院。

因為 NIST 有提一個 AI 的框架,我當時想像資安院就要有這些。

要把數位訊息防護擴大到⋯⋯

「合成訊息防護」?

當時 JR 跟孔院士講說弄一個臺灣資訊安全學校,孔院士沒有拒絕,後來我跟他聊說人工智慧學校做,「AI in security、security in AI」,然後這個是他們 AIA 董事會同意,孔院士又補一個,除了「AI in security、security in AI」,他把 data security 獨立出來,因為前一陣子在寫同態加密,你也做過一陣子。

有,我當時跟國網的同仁說:「你們算力夠,很適合來做隱私強化技術。」因為這個很花算力,而且已經買了設備。

我覺得這樣子很好,本來在資安院的章程也可以做驗測和 PETs,這也是在「安全、安心及安穩的數位環境」範圍裡,我這幾天再跟何院長討論看看。

至於 1999 這類的 Q&A,我並不反對去找 use case,但在跨部會署提驗測時,我應該不會放進去。

資安院如果要有一組人來做,就是專門做資訊量對稱的,特別是翻譯跟校對、mixed 國家語言的正確性、AI 安全性,用你剛剛講的 NIST 那套的框架做驗測中心,這樣就跟 TTC 的無人載具完全分開了。

對,而且事實上我也是傾向整個系統開發,我在做 AI 產品,可是驗測是獨立的。

對,不要一邊開發、一邊驗自己的,這也是我自己想說我們最多是協助驗測的角色。很難說自己開發、又自己驗開發的東西,感覺有一點奇怪。

這本身如果把這種獨立的做出來,大家有一個 follow 的做法。

對資安院的 credit 也會變好,也許比較可信。

所以右邊要自己提?

聽起來是要自己提,就不是和國科會合提?

這 2 億你們要不要貢獻資料或者怎麼樣?

因為台語 speech 並不是我們手上有的,我們多元司有 open data 的清單,但是國科會的資料市集那邊也有複製的方式,就直接用資料市集就好了。

多元司有的其實也是各部會的。

因為多元司清理好授權,以我所知,國網已經有一份,你就說從多元司過來的資料你要用,這樣就好了,這個是開放授權的好處。

我們通常要多元司申請案子的話,是要去清資料,但是國網也有人清資料、國研院也有人清資料,你不一定要用我們這邊清資料的能量。

我的具體建議是,國網之前辦過 Grand Challenge,所以對 speech 跟 text 的 domain 非常熟。

我就說那時陳良基第一次辦 AI Grand Challenge,我就說不可能做到,因為那個 Grand Challenge 是看那一幅畫,然後叫 AI 去講對這一幅畫的感覺,我說怎麼可能。

口述影像(笑)。

所以我的意思是,這邊的 dataset 不需要我們給,你就拿 open data,這個本來在國網就有一份了,如果是要混合語料,其實 Grand Challenge 那一組人都在國研院,對來源都非常熟。像你剛剛講 meta 那一組人的 TAT Corpus 也可以直接用,所以這個就不用數位部,但是數位部可以提驗測。

驗測如果要商轉,當然還是要產業署,但是這邊要獨立性、執行 NIST 的架構,我這幾天會跟資安院聊一下,看是不是可以接得起來。

驗測的可以擴充到某一些資訊的驗測。

我們的 end point 是國網的 crowd model 出來的時候,我們這邊就要可以開始測,不能等到 public demo 才測。這樣差不多了?

差不多,謝謝,這樣比較清楚。