IT之家 10 月 29 日消息,埃隆?馬斯克(Elon Musk)挑戰維基百科的新項目“Grokipedia”在公開亮相之初便遭遇“坎坷開局”,維基百科創始人吉米?威爾士(Jimmy Wales)當地時間周二在紐約舉行的 CNBC 科技高管理事會峰會(CNBC Technology Executive Council Summit)上表示,“我并不看好他現在能做出什么真正有用的東西。”
![]()
面對馬斯克關于維基百科存在“覺醒偏見”(woke bias)的指控,威爾士予以駁斥。“他對這一點完全誤解了,”他說,“他對維基的抱怨是,我們依賴主流信源。對此我毫無歉意。我們不會把隨機的怪人言論與《新英格蘭醫學雜志》(The New England Journal of Medicine)相提并論 —— 這并不代表我們‘覺醒’。這很矛盾,我們如此激進,以至于引用了《紐約時報》。”
“我還沒時間仔細研究 Grokipedia,應該會挺有意思。但顯然里面有很多贊美埃隆?馬斯克天才之處的內容。所以我敢肯定,這一定是完全中立的。”他補充道。
盡管威爾士對 Grokipedia(該項目本身已有維基百科詞條)進行了諷刺,但這并非出于與馬斯克的個人恩怨,而是源于他對所有大型語言模型(LLM)試圖打造可信賴在線信息源所做努力的深切擔憂。
“他所使用的那些用于撰寫內容的大型語言模型,必然會產生大量嚴重錯誤,”威爾士指出,“我們清楚地知道,無論是 ChatGPT 還是其他任何 LLM,目前都還不足以勝任撰寫維基條目的任務。”
而馬斯克顯然持相反觀點。周二晚間,他在社交媒體發文稱:“Grokipedia 將在廣度、深度和準確性上超越維基百科數個數量級。”
![]()
威爾士則列舉了多個現實案例,說明為何他不相信 LLM 能夠以極低的成本復制維基百科全球社區數十年來所建立的成果。他估計,維基媒體基金會每年的硬性技術成本約為 1.75 億美元(IT之家注:現匯率約合 12.42 億元人民幣),相比之下,大型科技公司持續向 AI 投入數十億美元資金;據華爾街某機構預測,所謂的“超大規模企業”明年在 AI 領域的總支出預計將達到 5500 億美元。
其中一個例子涉及威爾士的妻子。他表示,他常以一些冷門話題測試新興聊天機器人模型的能力。當他詢問“我的妻子是誰”時 —— 她雖非名人,但在英國政界有一定知名度 —— 幾乎所有模型都會給出“看似合理但實則錯誤”的答案。威爾士強調:“每當你要求 LLM 深入挖掘信息時,結果往往一團糟。”
他還提到一位德國維基社區成員開發了一個程序,用于驗證引用書籍的 ISBN 號碼,并成功追蹤到多處明顯錯誤的來源。最終發現,此人承認自己使用 ChatGPT 生成文獻引用,而該語言模型則“非常愉快地為你編造根本不存在的書籍”。
威爾士表示,無論是來自馬斯克的挑戰,還是 AI 技術的沖擊,這些爭議都在提醒維基百科一個嚴肅的問題:“對我們和整個維基社區而言,最重要的是以加倍堅持中立立場、嚴格審查信源的方式來回應此類批評。我們不應變成‘覺醒百科’(Wokepedia)。那不是我們應該成為的樣子,也不是公眾希望看到的。否則將嚴重損害人們對我們的信任。”
威爾士也坦言,公眾和媒體常常給予維基百科過高的評價。他表示,在維基早期,網站的實際質量遠沒有當時人們調侃得那么糟糕;但如今,“我們也并不像大家想象的那么優秀。當然,我們比過去好得多,但仍有許多工作要做。”
他預計,隨著技術發展和虛假信息泛濫,未來的挑戰將更加嚴峻 —— 利用 LLM 制造帶有看似可信文本的虛假網站的能力正迅速提升,很可能足以欺騙普通大眾。然而,他相信這樣的內容很難騙過維基社區。“畢竟我們花了 25 年時間研究和辯論何為可信的信息來源。但它會騙倒很多人,這才是真正的麻煩。”
不過,威爾士也承認,這項“擅長無中生有、產出完全無用內容”的新技術,或許也能為維基百科所用。他正在探索一些有限的應用場景,例如利用生成式 AI 從現有資料中挖掘應被補充進維基條目的額外信息。他認為這類應用目前“還算勉強可用”。
“也許它能幫我們更快完成工作,”他說。如果維基百科能開發并訓練屬于自己的語言模型,這種反饋機制可能極具價值。但鑒于相關成本高昂,目前網站仍暫緩正式推進此類項目,僅繼續進行技術測試。
“我們很欣慰維基已成為世界基礎設施的一部分,但這同時也帶來了沉重的責任。因此,當人們說我們存在偏見時,我們必須認真對待,并積極改進相關問題。”威爾士說。
但他最后仍忍不住再次調侃:“我們總在談論 ChatGPT 犯的錯誤。試想一下,如果有一種 AI 只用推特(Twitter)數據來訓練,那會是怎樣?那將是一個瘋狂、憤怒、被荒謬信息喂養出來的 AI。”





京公網安備 11011402013531號