• 在本週二,美國總統川普(Donald Trump)稱中國企業 DeepSeek 的崛起,對美國科技產業而言是一記警鐘。該公司的人工智慧(AI)模型一經問世便引發震撼,尤其在華爾街更是如此。包括 NVIDIA 在內的一些主要科技企業股價大幅下跌,這家晶片巨頭市值蒸發近 6000 億美元。

  • DeepSeek 聲稱,他們的模型研發成本遠低於競爭對手。此外,它也引發了一些國家的資安疑慮。舉例來說,澳洲科技部長就呼籲各界要保持謹慎。不過,儘管如此,DeepSeek 在推出僅一週後,已經成為美國下載量最高的免費應用程式。

  • 今天我們要和臺灣的數位治理大使、前數位發展部長唐鳳(Audrey Tang)一起討論此事,以及更多關於 AI 產業的議題。歡迎您來到節目當中。請問您認為 DeepSeek 的優勢是什麼?

  • 不好意思,能請您再重複一下問題嗎?

  • 好的,我想請問 DeepSeek 的優勢在哪裡?在這麼早的階段,就能展現哪些令人印象深刻的特點呢?

  • 它最大的獨特之處,在於能壓縮到一台高階筆電上運行。

  • 因此,儘管前沿實驗室需要大量的運算與維運成本,但如今在手機或筆電上,也能運行 DeepSeek 的精簡版本。

  • 不過也正因如此,往往隨同服務提供的保護機制(guardrails),可以在本地端被完全消融(ablated)刪去。

  • 如此一來,要把 AI 武器化,用於激化社會分歧、釣魚式攻擊、宣傳操作等目的,都變得更加容易。

  • 好的,這裡面可以討論的面向相當多。我們先從較小的模型這部分著手。這是否就是 DeepSeek 能以遠低於其他競爭對手成本進行開發的原因之一?

  • DeepSeek R1 的訓練方法,主要是讓 AI 自問自答,並透過「判定對或錯」的過程——例如數學或程式碼題目——來驗證自己的思考脈絡。

  • 過去,大量的資料蒐集或人工標註都十分必要,但他們的訓練流程顯示,只要在任何能以標準答案驗證的領域,都能顯著降低訓練成本。

  • 那這是否意味著其他競爭對手也會跟進?整體的開發成本都會變得更低嗎?

  • 某種程度上,的確如此。DeepSeek R1 並不是第一個發現「推理模型」技術細節的團隊。在 DeepSeek R1 之前,像是 Google Gemini 的「思考」模型、Anthropic,以及 OpenAI 的 o1、o3 等等,都已展現了類似或更高的性能。

  • 主要的差異,在於 DeepSeek R1 更開放——人們可以自行部署它,也能用它來教導更小的模型,例如 LLaMA 或 Qwen,習得同樣的推理技巧。

  • 所以,雖然它並未在「推理能力」上做出真正的全新突破,但它大幅降低了技術取得的門檻。

  • 您剛剛提到了這項突破可能帶來的負面影響。能不能再進一步闡述您的主要擔憂?

  • 好的。在過去,不管是 OpenAI、Gemini,還是 Anthropic 的模型,只要是透過官方網頁或 API 提供服務,都會設置保護機制,以阻擋像是宣傳操作、錯誤資訊或釣魚式攻擊等惡意使用。

  • DeepSeek 雖然也在其網頁及應用程式裡,提供帶有保護機制的版本,但由於它開放且可自行下載運行,人們可以在本地端移除安全措施,進而產生更容易執行網路詐騙、煽動分化、騷擾或其他網路攻擊的可能性。

  • 同時,因為不再由集中式伺服器託管,也就無法在外部留下任何行為追蹤或稽核的記錄。

  • 這樣看來,某些國家的公民是否可能更容易遭遇國家級的操控行為?還是您認為此類風險更集中於犯罪組織、個人行為層面?

  • 國家級的行為者早就擁有類似能力,所以現在更值得關注的,是中小型的行為者也能取得這些技術。

  • 設想一下,詐騙集團在社交媒體上投放廣告,如果有人點擊,裡面可能會跳出某位「名人」,能即時與你互動,甚至看起來對你的背景有所了解、可以跟上你的邏輯進行對話,最後誘騙你購買偽冒商品或服務等等。

  • 以往,需要有人在背後操控,即「真人參與」。但有了 R1,規模較小的詐騙或犯罪集團,如今也能自行訓練並部署這類模型。

  • 非常感謝您,唐鳳,來自臺灣的無任所大使。感謝您接受我們的訪問。