-
主要是要跟政委談數據處理的部分,我們就請……
-
你們活動的title現在範圍很大,這個title真的不會被挑戰嗎(笑)?
-
我們也想聽聽看政委的意見。
-
先請你們解釋一下活動的規劃。
-
我先講一下,您剛剛提到會不會被挑戰的主題,我們是全台第一個數據處理中心成立的記者會,我們的時間是在12月14日,也就是星期五上午10點至12點的時間,我們舉辦的地點是在社企大樓三樓的空間。
-
目前會與會的貴賓,第一個是政委,再來是AI school的陳昇瑋執行長,另外兩個是我們的客戶,一個是日本的Incubit創辦人北村先生,另外一個是Viscovery陳仲璘先生,目前這是我們在整個記者會會邀請到的貴賓。
-
我簡單來講一下我們當天記者會的流程,我們記者會從10點開始,前面20分鐘是媒體接待,其實媒體不一定瞭解什麼是數據標註或者是數據處理,所以我們在記者會的現場有一些電腦、demo,讓記者可以體驗跟瞭解什麼是標註跟我們最瞭解的分類,我們在10點20分,我們的主持人會開始活動開場,一開場有短影片,最主要是介紹若水在數據處理的介紹與目前市場的概況,我們之後會請Sabrina進行大概15分鐘目前AI這個部門營運成立的過程及成果分享,裡面會包括到我們目前成立的過程、我們看到這個市場、及若水團隊在全球市場上的優勢。
-
我們也會製作一個程式讓記者更清楚瞭解Garbage in及Garbage out,也就是前端數據精準性與後端產生的影響。
-
之後會請政委致詞,致詞的方向是政委時常在很多的場合裡面談到AI對於社會創新的意義,這部分等一下我們可以討論一下,看政委的意見。
-
再來,政委這邊的致詞時間大概是10分鐘,之後我們就會請AI school執行長提到目前精準數據上的一些重要性,在致詞的這個部分結束之後,我們會有大概10分鐘的合照。
-
合照之後,下面進行的比較像我們在實際運用面上的趨勢座談,所以我們會先以目前在應用面的影片作開場,之後我們會有簡單的座談會,大概是半個小時的時間,最主要是由若水跟客戶端去討論目前數據標註在應用面的展現,還有精準數據對於AI效能影響、未來合作的藍圖,這是比較應用面的部分。
-
我們在座談結束之後,就會是媒體的採訪,還有媒體對於我們講的東西、對於旁邊故事有更多想要瞭解,就可以藉由這樣的時間來瞭解,這是整個記者會的流程。
-
我現在已經可以開始改上面的東西?
-
當然。
-
我先從最沒有爭議的改起。陳昇瑋辦的不是AI school,school指的是幼教或者是國教。他教的都不是小孩,辦的是AI Academy,所以這個用詞滿重要的,因為你找AI school會到錯的網站去,而且真的不是教小孩。
-
我會講「AI for good」沒有錯,但是沒有講過「AI for human good」。說「AI for humanity」我還比較能講,或者「AI for good」我還能講,但是你把「human good」的「good」會變成財貨的意思,這樣就怪怪的,並不是你們要的主題。
-
所以,我建議乾脆不要英文,不然直接把中文翻英文,也就是「AI for Social Innovation」,或者是「Social Innovation for AI」,甚至是「Digital Social Innovation」,「AI」根本不要出現,這樣的好處是,因為我是數位政委,不是AI政委,所以我會建議就「數位社會創新(digital social innovation )」,但是子題裡面還是可以有AI創造的機會,這一些沒有問題。
-
「若水」前面的「數據標駐」是這個「駐」嗎?
-
這個是錯字。
-
這個是單純的錯字,因為現在新造詞太多了,我不知道哪一些是、哪一些不是(笑)。
-
「數據精準的魔力程式」,你確定要把它叫「GI/GO」嗎?因為這我們都懂,但是我不知道大眾是不是懂。
-
其實第四個我們還在討論,重點是我們想要呈現的是,演算法跟data的重要性,因此這個部分我們剛剛也在討論要如何呈現比較好。
-
而且演算法歸演算法、data歸data,你到底要強調哪一些重要性?
-
我們要強調data的重要性,也就是data對於演算的重要性,也就是演算後的正確性或者是辨識度,對那個模型良好塑造的重要性。
-
「魔力程式」的「程式」是什麼意思?
-
我只是先取一個名字而已,我們之前有討論,希望可以透過你要放進好的資料跑出來的東西,跟丟進不好的資料跑出來的東西,其實是不一樣的。
-
這樣非常好,那這樣「程式」二字是多的,也就是講數據精準的魔力、精準數據的魔力,不然當你最後一個字是名詞,放在一個大家都懂的地方,而數據都還不太懂的時候,大家會覺得你要講程式,沒有人會覺得你要講數據,所以程式就刪掉了;「Garbage in」跟「Garbage out」我不反對,只是這樣要稍微解釋一下。其他都沒有太大的問題。
-
後面「標駐」的「駐」還是錯字;「公司未來發展」是「incubit」或者是「viscovery」?
-
應該是「incubit」、「viscovery」,因為是panel discussion,與談「incubit」或者是「viscovery」可以談一下未來的應用,還有跟我們後來在data處理上的未來可能性。
-
這樣子我會建議你把題目做大一點,好比像「未來趨勢發展及與若水合作的藍圖」,你不要兩個「未來」,意思不大;第二個是他們不一定做得到,但覺得產業界一定會有的事情,不然有一種商展的感覺,這可能不是他們要的。以上是不太有爭議的,我們回到最有爭議的標題。
-
這個標題的想法是什麼?因為我馬上可以想像得到南港生技園區、國網中心的人跑來說:「為什麼你們做的是精準數據,我們做精準醫療跟地質,又或者是精準氣象預測,而且我們用的是超級電腦,而且我們也有用虛擬軟體,為什麼你們是精準數據,我們反而不是。」你們要如何回覆?
-
政委提醒的很好,我們那時在定義的時候是用data taking outsourcing的BPO概念在談這一件事,剛剛提到的國網是已經把AI的服務都綁得很完整了,所以變成是我們如何營造出一個具體,就是data taking的數據處理outsourcing的商業模式,可以for整個AI在研發過程中,我們是數據處理很好的夥伴,有一點是AI產業所謂價值鏈有一塊是可不可能切出來為數據清理的layer的BPO角色在?
-
這樣就不是中心了。因為資料就是蒐集、處理、利用,如果你是處理中心,意思是你把「處理」這一環都自己做,但不是,你們只是從「蒐集」到處理前端切一塊出來做而已,我如果沒有理解錯吧!處理後端也不是你們做,所以是從蒐集到處理前端,對不對?
-
-
這樣的話,你把它叫做「中心」,那就相當名不副實,不如真的很誠實說「唯一精準數據標註夥伴關係」之類的,這個維度都會比「中心」二字好,因為任何人也不只臺灣人,看到「中心」都不會想到產業鏈切一塊出來,想到的是分散在各個地方,產業鏈也沒有切出來,所以中心不太對。
-
我們最近看中國或者是日本是在處理中文翻譯,是比較適合寫數據處理或者是數據標註?因為我們本來會說「數據處理」的原因是因為collection加taking,但是整個在用詞、用語上,對這一件事的認知會不太相同。
-
因為「處理太大了」,但是「標註又太小了」,所以你現在又需要一個介於處理跟標註中間的詞來處理這個。
-
有市場廣義的用語嗎?
-
因為你現在前面加「精準」,「精準」在這裡到底是什麼意思?
-
「精準」的意思是像國際上在處理數據上,比如像cloud sourcing的方式,基本上標出來的數據,就我的客戶回饋給我是不精準的,所以這個data其實沒有辦法讓他的模型做得非常非常地好,因此我們才說收斂這一些事的狀況上,我們為何要收斂到這裡。
-
所以你的「精準」是修飾處理,你的「精準」不是修飾數據?
-
-
可是沒有人看得懂,大家一定都覺得「精準數據」是一個詞,然後你在處理「精準數據」,「不精準數據」就不要送到你們這邊來,但意思好像不是這樣子,因為當精準作為形容詞的時候,大家最常聽到是「精準醫療」跟「精準導彈轟炸」——但是那個先不管它(笑)——但那兩個都有很明確的意義,你有一個明確的受體,針對明確的受體來進行工作,但你們的精準完全不是這個意思,所以會產生形容詞上的混淆,你拿來當作形容數據,但你的意思是處理的意思。
-
如果一定要放在數據前面,不如寫「高品質」,如果可以接在後面,那就想一個詞來講,但是你不能既放數據,又把它叫「精準」,這樣難以看得懂。
-
所以「全台唯一……」……
-
我們在發想這個標題的時候,其實真正核心的concept,因為臺灣並沒有一個組織或是公司,專門在這一個產業鏈當中提供資料標註精準的這件事,就是品質的事,所以這是原始的concept,所以有兩個議題,我們要討論一下,是全台唯一,因為未來可能會有其他的player出來。
-
我們講的是現階段。
-
第二件事如剛剛所提到的,數據處理或是標註——標註太少——處理很容易混淆的狀況下,所以這個詞也是我們現在一直在抓的,所以這個我們再順一下。
-
我們是不是全部放在一起,就是「全台唯一」是固定的,這四個字先留著,「精準標註」四字也是可以的,而且你們可能之後就說「精準標註」,這可能是很好的(詞),對不對?
-
接下來就是「數據處理團隊」、「數據處理服務」、「數據處理夥伴關係」,隨便啦!你高興就好。這樣就比較名副其實,不過唯一的問題是字太多了,你要分大標、小標,不過大、小標都很好,因為你前面要是「若水AI」,這才是大的,接下來才是「全台唯一精準標註」,接下來才是「數據處理服務」。
-
我們這樣稍微重新排列一下,就會變成我現在投影上的這樣子:「若水 AI 數據處理服務 / 『精準標註 全台唯一』」,並不是修飾AI數據,要不要考慮一下?
-
好,謝謝。
-
其他都非常好,我沒有別的意見。
-
謝謝政委。我們會再提到的兩個地方,一個是home agent就業機會,也就是居家身障者,也跟政委報告我們現在在年底的時候,應該會有將近100位的居家身障者其實投入我們做我們現在客戶的標準工作上。
-
你們剛剛說home?
-
home agent就是居家身障者的夥伴,所以在這裡面,政委可能在提的時候,也提到「for good」這一件事其實是兩面的,一個是對市場面,AI不完全取代人力,我看政委其實在很多面向上一直在談社會創新這一件事,另外一塊是for 弱勢就業的事,其實我們之前也有提到的主體。
-
OK。
-
我們後續再修一下,再把確認的東西寄給筱婷。
-
昇瑋這邊的主要論述是用「資料」,因為他處理的包含數據資料跟文字資料,所以一般不會把數據挑出來講。
-
但是因為你們這邊花了非常多的時間講數據,所以就要看你們。你們現在是不碰文字資料,對不對?
-
我們比較偏向電腦視覺的部分,所以也要談一下這一個部分,我們的確有同事參加他的人工智慧學校,他有開班,其實中間我們也知道昇瑋執行長在做的部分,比較少touch電腦視覺這一塊,所以也要跟昇瑋討論細節,或者是政委可以推薦?
-
昇瑋很ok。你只要先提供一些超參數,他絕對可以做出很好的演講。(笑)
-
只是他偏文字跟數據那一塊。
-
文字跟多媒體是他的強項,但因為你們目前確實比較在數字、圖片的domain,所以你們用「數據處理」是非常對的,因為如果你們說是資料處理,就一堆別的東西來找你們了。
-
只是未來趨勢跟數據的重要性,這個title非常好,但是要確定傳送的訊息是不會覺得太窄,你們又不會覺得太偏的東西,這可能需要一點對齊。其他都很好。
-
政委,您之前有提到「AI產業化」跟「產業AI化」,我們現在在打臺灣跟日本的市場,看到同樣的狀況,所以就您現在看起來,如果以「產業AI化」的話,缺哪一塊拼圖?
-
最缺的是「體驗設計師」,其實就是當作「職再」,你們不是最會這個嗎?也就是「職務流程再設計」,這是各位的強項。
-
其實像有些AI,你也可以當作是特殊身心狀況的朋友,他的身體移動,小肌肉就沒有那麼好,但是大肌肉的力量就滿強的,如果你接機器人的話,或者他的認知功能是非常狹窄的領域,你給他一定輸入的話,他的輸出效能很高,但是一旦需要常識就不太行。事實上人類裡面也有像這樣的。
-
我的意思是,你可以針對AI的特性去做職務流程再設計,再設計之後,你讓這一些AI能有更好的學習環境,這樣你的數據精確度就增加,不然按照一般設計給人類的職場,取得有效數據的能力是非常弱的。
-
所以為了AI,把AI當作一種多元身心狀態者去做職務流程再設計,我們現在叫做「工作體驗設計」,甚至我都很想說這就是「職再」,就不要再發明新名詞,這個有一個好處是「職再」你們已經很懂,現在只是把一群身心障礙有一個情況的朋友,跟另外一群有身心障礙別的情況——不是人類——的朋友有更好的互動,也就是AI(人工智慧)乘上 CI(群眾智慧)。
-
這個是大部分看到AI有一個趨勢,大家翻譯成「擴充智慧」或者「擴增智慧」(Augmented Intelligence),那個「人工」就拿掉了。
-
從「擴增智慧」的角度來看,那就有雙重角色,就是自主進行資料蒐集及預測的時候,你把它放在職再適合做這個的位置。另外,當它需要判斷或是行動的時候,你把人放在這一個位置,但讓AI來增強,這兩個都是職務流程再設計的工作,因為以前是放在同一個人身上,那個人就是那一條龍,現在是拆開。
-
因此我會建議你論述上可以這樣論述,比較符合所謂「產業AI化」的趨勢,這當然跟「AI產業化」毫無關聯,你們也許也沒有要碰。
-
我們主要是「產業AI化」的這一件事。謝謝政委。
-
謝謝。
-
當天政委會提早離開,所以我們會在11點左右的時候就完成。
-
沒有問題,謝謝。