-
AI 越來越像人。最近在音訊處理領域,它們在掌握情感表達、非語言線索和聲音語調方面,有時甚至超越了人類。
例如,谷歌(Google)旗下 AI 筆記與研究應用程式 NotebookLM,在九月中旬推出「Audio Overview(音訊概述)」功能,能直接把整篇論文變成 Podcast,特別適合偏好以聆聽代替閱讀的人。其呈現出來的作品,不只內容上下文通順,連聲音表情也恰到好處。
另一個名為 Hume(休姆)的應用軟體,則有如一位心理輔導師。使用者透過手機麥克風和它閒聊,它能回應你的正面、負面情感,接著提供引導,協助人管理思緒與情緒。
也就是說,AI 發展至今,不僅能表現出細微的聲音表情,還能聽出一個人發言時的情緒狀態。
AI 有了這個能力,可以用來做什麼?答案是,協助人類傾聽。
這在公共事務上特別能派上用場,選舉是其中典型的應用場景。如美國波士頓市長吳弭 2021 年競選時,就採用「Real Talk For Change」系統來回應選民的訴求,那是一款來自 AI 新創非營利團隊 Cortico 所開發的平台。
去年,Cortico 開發了一款與平台整合的 App。它的具體使用方法,是錄下團體討論時的各方發言,透過 AI 分析發言者所用的字句、聲音表情,歸類並總結重點,協助找出各組參與者之間有共鳴的見解,再公開在網站上、呈現給決策者。
以往,決策通常是通過投票產生,可能僅限於少數選項,無法說服所有人。上述方法則有所不同;通過廣泛傾聽,它可以發掘出參與者之間的粗略共識,以及共同的價值觀。這使得各群體之間更容易相互聆聽,縮小對立雙方之間的差距。
AI 能「理解」人類語言,確實彌補了人類先天的不足。因為,當一個人試圖傾聽另一個人時,有許多變數—例如聽者的個性、性格、理性和感性傾向、認知能力等等。即使受過專業訓練,要一直維持主動傾聽的狀態也很困難。相比之下,AI 沒有這些干擾;由於沒有自我,它可以扮演不知疲倦的聆聽者角色。
但即使 AI 的功能日益強大,也不代表它能完全取代人類。正如 Cortico 的例子,對話仍需在人與人之間進行,而非每個人各自與機器互動。如此一來,AI 充當人與人之間的橋樑,幫助找到真正的共識,填補溝通拼圖中缺失的一塊。即使群體之間存在巨大差異的鴻溝,隨著 AI 功能越來越強大,也變得有機會被填補。
-
(採訪及整理:方歆婷。授權:CC BY 4.0)