點子農場/數位殖民時代來了…

每天思考、書寫AI,我發現,臺灣正處於從來沒經歷過的「AI數位殖民」年代,我們是全球最重要的AI硬體制造者,卻在AI的知識生產、文化塑造、價值設定上幾乎缺席。當臺灣人花了愈來愈多的時間用AI,每一個使用行爲,都在訓練別人的模型,強化別人的優勢,加深我們對外國科技霸權的依賴。

倫敦政經學院教授Nick Couldry與美國紐約州立大學教授Ulises Mejias,花了十年研究這個現象,把它命名爲「資料殖民主義(Data Colonialism)」。他們在2024年出版的《Data Grab》裡說得很直接:舊殖民主義掠奪土地、資源與勞動力;新殖民主義掠奪的是我們日常生活的流動,以數位資料的抽象形式被提取。

科技公司讓我們簽署看不懂的條款,拿走我們的資料,只因爲那些資料就在那裡。殖民主義沒有消失,它只是換了形式。

2025年,印度學者Divya Lakshmi在《Frontiers in Communication》發表了一篇措辭犀利的論文,標題是〈在生成式AI時代,爲帝國重新包裝品牌〉。她寫道:生成式AI的問題已經不再是「誰能說話」,而是「誰能透過機器說話」。她引用一個具體的數據:GPT-4o反映某個社會價值觀的能力,有44%直接取決於該語言的數位資料量,低資源語言的錯誤率是高資源語言的五倍以上。

你的語言在網路上的資料愈少,AI就愈不懂你,愈容易用別人的眼光來描述你。臺語、客語、原住民語,通通在這個不利的位置上。

巴西利亞大學2025年的研究則指出了一個更深的問題:即使是那些標榜「負責任AI」的倫理框架,本身也可能是一種文明化使命的話術,讓被殖民者接受殖民者定義的「什麼是好的AI」。這個論點,讓人不寒而慄。

AI的殖民性,核心不在於它做了什麼,而在於它決定了什麼知識是「合法的」,什麼聲音值得被聽見。

臺灣的AI數位殖民,有兩個具體的面貌。

第一,語言主體性的侵蝕。ChatGPT對臺語只是略懂,研究者必須把公視臺語臺的節目全部爬出來,才勉強湊出足夠的訓練資料。

第二,算力的懸殊。OpenAI訓練GPT-4耗資約新臺幣32億元,使用2.5萬個GPU;臺灣整個國家隊只有72片GPU。

第三,也是最隱形的:每當AI在判斷什麼是「正常的」臺灣文化、「標準的」繁體中文、「合理的」兩岸論述,背後都有一套我們沒有參與制定的規則在運作。

這不是陰謀論,這是結構問題。當訓練資料的構成決定了AI的世界觀,而臺灣在這套資料裡幾乎缺席,後果就是我們的孩子用AI認識的「臺灣」,是別人眼中的臺灣。

面對這樣的困境,倡議和建構「三意AI」,可能臺灣社會是最好的解方之一。三意AI不是一個產品,不是一個品牌,而是一種使用AI的倫理立場。它問三個問題:這個AI有沒有放大臺灣的文化主體性,還是在稀釋它?這個AI的紅利,有沒有流向偏鄉的孩子、高齡的長者、說着快要消失的語言的族人?這個AI的商業模式,能不能自我造血,讓公益不必靠補貼維持?

這三個問題,也是對臺灣AI基本法的期待。一部真正屬於臺灣的AI基本法,應該把這三個問題寫進去,讓它成爲評估每一個進入臺灣的AI系統的標準。