• 我們先談一下,就是當初其實你第一次使用到 DeepSeek 的時候,那個經驗是怎樣的?因為它上個禮拜出來的時候,大家就是感覺很驚豔的樣子嘛。

  • 嗯,你指的是 DeepSeek R1,是不是?就是最新的這個模型?

  • 是,最新的這個版本。

  • 我是應該是 13 天前注意到的,就兩個星期前。當時它並沒有什麼媒體的報導,就是上傳到了 Hugging Face 上面。

  • 因為我本來就有這個習慣,會把 Hugging Face 上面新的這些模型下載下來。那所以就是下載下來,然後就很自然地就自己來使用這樣。

  • 那當初你第一次使用到那個 R1 的時候,你自己的使用經驗是如何?就是會覺得說它真的很……就是有點超越了現在那個 OpenAI 的那個模型?

  • 因為我自己是 O1 Pro 的使用者,所以 O1 Pro 我日常相當常使用。當然,跟 O1 Pro 相比的話,R1 並沒有比較精確,也沒有比較有創造力,在各方面來講,都並沒有到 O1 Pro 的那個程度。

  • 是。所以就是看到上個禮拜,很多媒體都將 R1 跟 O1 Pro 去做一個比較的時候,你自己看到的感覺是怎麼樣的?

  • 因為 O1 Pro 它是 O1 用比較多的算力的版本。那大部分的使用者,用的 O1 可能是算力比較小的版本,不管是 O1 Mini 或者是 O1。所以跟那些相比的話,特別是在華文的處理上面,當然會覺得說 DeepSeek 比較流暢,比起 O1 來講,那當然也是因為它訓練裡面比較多華文的語料。

  • 那當你用到 O1 Pro 的時候,它對於華文,以及各個地方不同的華文各自的特性,它的掌握就還是更深一點。

  • 瞭解。那當初其實就是,因為看到你在回覆的時候,會跟大家講那個破解的方法。其實當時就是想到那個破解方法的時候,是因為知道可能離線的版本比較沒有那麼多審查?還是就是如何去進行這個破解審查的步驟?

  • 先要講的是,當時我並沒有去使用網頁上或者 APP 上面的版本,我並沒有管這件事情,因為我通常都是直接關注 Hugging Face 上面的模型。

  • 那當然我也觀測到說,它裡面可能有兩層結構:一層是碰到政治議題或者敏感話題的時候,它就想都不想,就會講出官方的敘事來。

  • 所以你可以觀察到,在普通的題目上面,它都會先有一個思考的過程,思考完之後再進行回答;但是如果是碰到特定的關鍵詞,它思考的過程會跳過,那就直接回答一個官方敘事的版本。這個是不常見的,就是顯然是它特別有設計這一段進去。

  • 另外一個,也是大家也在講的,就是說它因為訓練的資料集,可能對於不管政治啊、社會科學類的問題等等,它的那些資料集的來源可能有特定的意識形態。所以它會想、也會回答,但是那個回答裡面帶著那些意識形態,那當然也是有這個部分。不過我首先注意到的是前面的那個部分。

  • 是。那所以當時其實注意到那個部分的時候,就是知道其實可能離線版本,它會比較沒有線上或者是它 APP 的版本那麼多嚴重的審查。

  • 還有因為剛才有提到說,那個思考的過程它會展現出來。可是我在 research 的時候,我看到有不少的用戶,他們嘗試輸入一些敏感的詞去查的時候,線上的版本可能有嘗試去輸入一些答案出來,可是可能兩秒之後就已經刪除了,就是那個沒有辦法?

  • 對,這是額外的,就是說這裡總共有三層系統:

  • 第一層是線上或 app 才有的,它即使開始回答,也會被蓋過。

  • 第二個是我剛才講的,就是說即使是在離線的版本裡頭,它也是有對於關鍵詞跟歷史事件,會跳過思考去做出不自然的這種迴避。那這個當然也會引發大家不信任,或者不想使用,覺得審查痕跡太深。

  • 第三個才是它自然的回答,但是回答裡面透露出特定的意識形態。

  • 是。所以那個它透露出的那個意識形態,也是因為透過它本身的那個模型的訓練去把它……怎麼講,就是餵出來的一個情況出現嗎?

  • 對。但是我們目前也已經看到,像 Perplexity.ai 它所內嵌的那個 R1 的版本,就是他們已經透過模型的權重的修改,把裡面自我審查、不自然的迴避等等這些部分都去除了。所以你即使是在 Perplexity 不開搜尋,你用所謂的輔助寫作模式,去問 Perplexity 版本的 R1 這些問題,包含剛才講到的關鍵詞、歷史事件,它都會很正常地回答。

  • 這就表示說,事實上是因為它的權重釋出,可以修改到可以把這些不自然的迴避去除掉。

  • 剛才我們有談到,可能就是你不同的指令或者是那個關鍵詞,為什麼會出現這麼不一樣的結果?比方說你用那個「天安門事件」跟「天安門屠殺」,就會出來非常不一樣的回答內容。

  • 我還沒試過「天安門屠殺」,我是試「天安門慘案」。

  • 因為它的本質是一個文字接龍嘛,所以不同的措辭,它後面通常就會接不同的描述,也就是那個措辭本身是有一個定性的。

  • 我想我們在寫作的時候也會看到,像一篇報導的標題,它標題使用什麼,那你大概也可以猜出它裡面的內文要用什麼樣的筆調來描寫。

  • 因為語言模型它基本上是接龍的能力,所以你在告訴它標題之後,它後面的那個回答的內容,也就會跟著這樣子來接續。

  • 是。可是當時其實有想過,比方說線上的版本,它會出現這麼多審查的情況,因為我看有一些的報導裡面講說,問「習近平是誰」他其實也不願意回答,好像很多的話題他都不願意去回答的狀況?

  • 所以我剛才有強調,就是說我們臺灣當然是非常強調言論自由,強調多元參與。如果碰到技術或者產品有這樣子的情況的時候,一方面當然比較不信任、不想使用,二方面就是會運用我剛才所說的其他那些技術。

  • 好比說我舉例,除了 Perplexity 之外,Hugging Face,也就是我一開始發現有這個模型的地方,他們自己也開始了所謂的 Open-R1,也就是說運用 R1 的這種訓練的方式,但是不加入審查模組。

  • 所以不是說把 R1 下載下來之後,把審查模組去削除掉,而是沿著 R1 的方式重新訓練一次,從一開始就不加入這些審查模組。那這個情況下,當然將訓練出來的 Open-R1,相信在這方面就不會有這種讓人覺得「怎麼忽然之間就很不自然」的回應情況。

  • 所以也可以期望說,像 Open-R1 這樣子比較透明的模型,也可以更多地被運用在其他的大廠裡面,就不一定要自己再用 DeepSeek-R1 然後再去進行修改等等。那這是一部分。

  • 那另外一部分是說,我們也已經看到 Hugging Face 上面,開始有各國都自己拿了 R1,然後再加入自己的語言材料。那這樣子就比較容易來處理剛剛講第三層的這個問題,就是因為它比較片面地吸收一些資訊,所以導致它即使願意回答,還是有特定的意識形態。

  • 舉例來說,像日本的 CyberAgent,就運用日文的語料去做了額外的訓練,所以當你問這些敏感的問題,但是用日文問的時候,他就不會受到本來的意識形態限制。

  • 所以好像說,用英文在問的時候,線上的那個版本回答也會比較不一樣?

  • 對,相對上。但剛剛講的就是說,因為它的權重是開放的,所以當你下載下來,然後再繼續用好比像剛才講的日文語料來訓練的時候,它碰到日文的問題,就會傾向你後面給它加強的那個版本。

  • 所以目前看起來就是兩個:一個是比較徹底的,就是自己重新按照 R1 的做法訓練一次;第二個是拿著 R1 把它第二層的審查模組移除,或者是再加上新的語料,去讓它在第三層的意識形態做修正,那這樣是處理掉第二層跟第三層的問題。那第一層因為本來你下載下來,就不需要靠著它的網頁界面或者 app,所以這樣子的話,第一層本來就不存在問題。

  • 是。可是我在想說,如果技術沒有那麼強的使用者,可能他們只會使用那個 APP 或者是網頁的版本。那對於他們來講,其實這種言論審查會如何影響他們會選擇哪一種 AI 產品?或者是這種類型的產品,對於比較 layman 的人來說,他們那個潛在的問題會是什麼呢?

  • 我不確定您的意思是什麼?好比像說現在你如果到 chatgpt.com,那當然它不會提供 R1,它現在提供的是 O3 Mini。那你可以按個「思考」按鈕,就可以使用 O3 Mini。那 O3 Mini 在各方面都跟 R1 相比,很多方面更好一些。

  • 所以您剛剛講的是說,好,那我現在有免費的 O3 Mini 可以用,我有免費的 DeepSeek R1 可以用,在兩邊都可以用的情況下,大家做選擇的考量是什麼?是這樣的問題嗎?

  • 對對,類似。就是如果那個 APP 或者網頁的版本的 DeepSeek,它就很明顯有這種——如果你要問他一些正式的東西或者是社會的事情,他就會這樣去回答,而不是純粹的一些 code 或其他數據的推理。對於 user 來講,他們那個選擇會不會就不太會去選擇 DeepSeek 的使用呢?

  • 應該這樣講,就是說,如果同樣是免費的使用,那 DeepSeek 的品質又沒有特別更好,它又有這方面意識形態方面偏見的狀況,那當然對使用者來說,這並不是一個取捨。

  • 也就是說,我既可以用功能同等或者更好,而且又比較沒有這種意識形態的問題,那大部分使用者應該還是會去使用比較沒有這方面問題的。

  • 你剛剛的問題只有在要做出權衡時:就是 DeepSeek R1 真的比其他的產品都好得多,而且讓大家覺得好像非得忍受一下它的意識形態審查機制——那樣才會造成問題,但是現在並沒有。

  • 除了 OpenAI 之外,像 Gemini 它也有 AI Studio,裡面也有它所謂的 Flash Thinking,事實上現在在很多排名裡面是最好的,所以同樣地,它也沒有這種意識形態的問題。那也有很多人,如果完全不願意付錢的話,也可以直接去使用 Gemini 的 Flash Thinking。

  • 瞭解。關於這個問題,也是因為比方說不是華文的地區,就在上個禮拜——不是說它在應用程式的一些商店,就上到了第二名的下載排行榜嗎?所以如果他是透過應用程式商店去下載 APP 版本。

  • 我在想,對於那些會下載 APP 的人來講,DeepSeek 對他們的吸引力到底是什麼呢?如果他會有這麼多審查問題存在?

  • 一方面是說,因為各地的新聞都在討論嘛,那下載 APP 並不是需要花很多時間,所以很多人會看到新聞就覺得「那我也來用一下看看」。

  • 當然在臺灣這邊,我們也看到像數位發展部已經很快就說,你如果使用它的 APP 或者用它的網頁服務,那資料基本上它的儲存以及之後怎麼運用等等,基本上就是 DeepSeek 那家公司說了算。

  • 所以數位發展部馬上就提出說,在公部門也好,公立學校也好,它是所謂的危害產品,就是說跟 TikTok 一樣,是中共可以實質控制的,所以不能來使用。它特別講的就是 DeepSeek 的這個服務,包含 web 跟 app 的部分。

  • 有這方面的風險嗎?所以它的情況也會跟其他中國的那種 APP 很類似嗎?比方說小紅書啊那些?

  • 對,我們在 2019 年開始,就有《危害國家資通安全產品限制使用原則》。這個原則著重的就是,不管它標明產地是哪個國家,只要是受境外敵對勢力的實質控制,那公務機關無論是他們自行營運,或者委外營運、提供公眾活動使用的場地等等,都是限制的。主要原因當然就是它的實質控制權,這個遙控權並不在我們可掌握的範圍之中。

  • 那當然,如果是像剛剛講到的 Hugging Face,自己按照 R1 那篇論文重新訓練出 Open-R1,就沒有這個問題。雖然它用的原理是一樣的,但是實質的控制權並不是在北京當局手上。

  • 瞭解。所以現在各地方開始提出的那些安全風險的擔憂,主要就是跟你剛才談的比較類似?

  • 對,就是他的擔憂第一層是,這個 APP 或者這個網頁會在沒有辦法有效監管的情況下外流,並且構成危害的風險,這是第一層。

  • 我們剛剛另外講的包含第二層、第三層,就是這個模型的權重裡面內建一些審查的本能,以及它的訓練資料裡面帶有特定的意識形態。那這是不同層。所以剛剛講的「危害產品」,是在講第一層。

  • 那它的意識形態會導致的那個安全風險,會不會是在使用者使用的時候,影響到它回答的那個方向?

  • 這是一個嘛。那另外一個就是,如果你去看 R1 的論文的話,它特別有對於怎麼樣幫助使用者、怎麼樣減少對使用者的危害,做一些訓練,但是在「誠實」上面,論文裡面比較沒有提到。

  • 那這樣的結果就是說,你要求 DeepSeek-R1 模型生成一些比較惡意的用途,好比像去進行人身攻擊,或者是去進行一些訊息散佈、詐騙劇本等等,它基本上是不會拒絕的。

  • 所以這也是另外一個方面,就是它在訓練過程裡面儘可能去迎合使用者的需要,但如果使用者是具有惡意的使用者,它比較沒有做這方面的防制。

  • 瞭解。那其實它現在所面對的一些審查情況,會不會影響到它作為一個讓 R1 模型讓大家比較驚豔的情況?還是說其實只要你下載下來,再進行自己的一個訓練,其實也不太會影響?

  • 應該是,剛剛講說如果像 Perplexity,那樣子看起來是蠻徹底地去突破第二層。如果你是用它來進行網頁檢索搜尋,它會有 grounding,就是它會用找出來的那些網頁結果當作事實,所以它在第三層的這個自己「幻覺」出特定意識形態的問題,也比較不大,因為它會用實際網頁找出來的那些結果來做 grounding。

  • 所以用 Perplexity 的版本,我目前到現在的感覺,不能說完全解決第二層、第三層的問題,但是已經有效去防堵到一個程度。但當然要徹底解決這個問題,還是像剛剛講到的 Open-R1 這樣子,重新訓練一個。

  • 那當然也有一個很簡單的,就是大家也可以去用 Gemini Thinking,那個也是免費的,或者是 O3 Mini 等等,用其他 AI 公司的模型。因為在大家所看中的那些層面,包含寫程式、推理等等上面,Gemini Thinking 或者 O3 Mini 並沒有比較差,所以其實這不是一個需要做出的權衡。

  • 是,瞭解。那對你來說,這個 R1 的發展,你自己使用了這麼久,你的感覺是如何呢?

  • 倒沒有,我就像我剛剛講的,我到現在還是主要用的是 O1 Pro。

  • 所以我只是說,它剛出來的時候,就剛出來一兩天吧,我因為定期會看 Hugging Face 上面新的模型,所以有下載下來在本機來試用。那 Perplexity R1 剛出的時候,我因為想知道它有移除掉多少這種審查,所以也用了一陣子。但是我現在日常最常用的,還是 O1 Pro,然後配一些 O3 Mini High。

  • 瞭解。那最後一個問題想問一下,現在大家到這個禮拜也還在討論 DeepSeek 的事情。你自己如何……雖然它的討論現在也只有一個禮拜而已,可是你有沒有一些想法?你如何看待 DeepSeek 之後的發展呢?

  • 我覺得比較重要的還是說,因為這個禮拜,大家對於自己的資料權利、隱私權利、言論自由等等,越來越重視了,可以看到討論都是繞著這個在轉。

  • 我覺得這是很好的事情,因為大家越注重這些基本的人權——人權不只是存在於類比世界,線上世界也是一樣的。所以這個部分,我覺得越討論,大家就越會有一個共識,就是你至少需要尊重到哪些權利才是好的。

  • 那這也對於接下來 open source(開源)的發展,是一件正面的事情。因為在國際上面也有討論說,open source 到底能不能促進我們剛剛講到的那些權利,還是因為很容易產生詐騙、深偽等等,會削弱這些權利?這是一個很大的討論。

  • 但如果現在大家的討論是往「open source 怎麼樣才能盡到社會責任,甚至是能夠透過開源的方式,一起設計某些能夠抵禦惡意用途的共通工具」等等,那這樣大家就會把 open source 接下來的發展,引導到對社會、對人權都比較好的一個方向。

  • 好,那我今天想問的問題就差不多。非常感謝,你這麼晚都還在接受我的訪問。

  • 沒問題,感謝。我後面這一段我會做逐字稿,但是我會等您發佈之後再發布。

  • 好,沒問題。那之後如果這篇文章這個禮拜出來了,我就再把連結發給你。

  • 好的,謝謝。