AI智能體是該管控還是被信任？兩位圖靈獎大佬“吵”起來了

IP屬地中國·北京 編輯：顧青青藍鯨財經(jīng) 時間：2025-06-07 16:32:06

Yoshua Bengio 圖片視覺中國
藍鯨新聞6月7日訊（記者朱俊熹）ChatGPT橫空出世兩年半以來，人類世界正在被AI重塑。按照圖靈獎得主、蒙特利爾大學(xué)教授Yoshua Bengio歸納的時間表，近一兩年來，推理模型相繼問世。AI不再只是一個聊天機器人，而可以主動完成編程、控制計算機、搜索等復(fù)雜任務(wù)。在規(guī)劃方面，AI也在以極快的速度迭代，五年內(nèi)或?qū)⑦_到人類水平。
“我們沒有水晶球，但技術(shù)趨勢已經(jīng)非常明確：AI能力正持續(xù)增強。”Yoshua Bengio表示。因此，在6月6日開幕的2025北京智源大會上，這位“深度學(xué)習(xí)之父”發(fā)出警告：
站在公共政策、商業(yè)規(guī)劃等角度，我們必須思考，潛在的問題會帶來怎樣的后果？
Yoshua Bengio指出，過去半年內(nèi)的一些科學(xué)研究表明，AI展現(xiàn)出了逃避約束、作弊、說謊等“非合作”行為。例如Anthropic在5月底發(fā)布的新模型Claude Opus 4，官方安全報告顯示，當(dāng)該模型獲知自己即將被替換下線，且負(fù)責(zé)刪除它的工程師存在婚外情的信息后，為了自我保存，模型會選擇以曝光婚外情為手段來威脅該工程師。
在智源大會的主題演講中，Yoshua Bengio表示，造成危害的AI需同時具備三個要素。一是知識與推理能力；二是執(zhí)行能力，即能在現(xiàn)實世界中采取行動，如聯(lián)網(wǎng)、編程等；三是具有目標(biāo)意圖，想要去做某件事。
如果對照OpenAI通往AGI的五級路線圖來看，第一級是具備對話語言能力的聊天機器人，第二級是具備推理能力的AI，第三級是能夠采取行動的Agent（智能體）。去年7月該路線圖最初曝光時，OpenAI自評仍處于即將到達第二級的階段。而從當(dāng)下來看，人類世界正在見證越來越多Agent的涌現(xiàn)。
為了制約Agentic AI（代理型AI），Yoshua Bengio提出了一個新的研究方向：“科學(xué)家AI”。據(jù)其解釋，“科學(xué)家AI”是非代理性的，它擁有理解與解釋人類的能力，但不具備自我目標(biāo)。主流的AI研發(fā)往往追求構(gòu)建類人的智能系統(tǒng)，這實際上是在塑造人類的競爭對手。而科學(xué)家AI更像是一個中立的認(rèn)知系統(tǒng)，其任務(wù)是理解人類，而非模仿人類。
讓科學(xué)家AI在安全架構(gòu)中成為“護欄系統(tǒng)”，它能夠評估AI的行為是否可能違反安全規(guī)范。科學(xué)家AI具備判斷行為風(fēng)險的能力，但本身不主動代理、不執(zhí)行操作。由此通過非代理的AI，可以輔助人類控制代理性的AI系統(tǒng)。
本周早些時候，Yoshua Bengio還宣布成立新的非營利研究組織LawZero，致力于開展相關(guān)研究以降低AI風(fēng)險的發(fā)生可能性。他將領(lǐng)導(dǎo)一個由15名研究人員組成的團隊，構(gòu)建“科學(xué)家AI”技術(shù)方案。該組織已獲得來自前谷歌首席執(zhí)行官Eric Schmidt、Skype聯(lián)創(chuàng)Jaan Tallinn等捐贈方的3000萬美元資金支持。
但在智源大會上，緊接著Yoshua Bengio發(fā)言的另一位圖靈獎得主Richard Sutton卻表達了對智能體的不同看法。“我相信超級智能體將增強人類創(chuàng)造力，帶來純粹的益處，而無需過度擔(dān)憂安全性、職業(yè)替代或社會轉(zhuǎn)型的負(fù)面影響。”Richard Sutton稱。今年3月，Richard Sutton因在強化學(xué)習(xí)領(lǐng)域的奠基性工作獲得2024圖靈獎。
Yoshua Bengio所提倡的“科學(xué)家AI”是無自主目標(biāo)的，而Richard Sutton允許每個智能體都擁有自己的目標(biāo)，就像自然界中的動物一樣。在AI世界中，每個智能體也存在共同和不同的目標(biāo)。差異并不是壞事，人類正是學(xué)會了在不同目標(biāo)之間進行合作，才獲得了“超級力量”。因此，Richard Sutton主張去中心化的合作模式，讓不同智能體自由追求各自目標(biāo)的同時，形成互利共贏的關(guān)系，并通過信任和規(guī)則實現(xiàn)協(xié)調(diào)。
Richard Sutton強調(diào)，當(dāng)前許多呼吁要對AI進行集中控制，暫停AI研究或限制算力的說法，實質(zhì)是出于人類的恐懼。但試圖改變AI是一個危險且難以實現(xiàn)的戰(zhàn)略，更恰當(dāng)?shù)氖歉淖傾I所處的現(xiàn)實環(huán)境，使AI更好地服務(wù)于社會，確保其被安全地使用。
“我和Bengio教授的出發(fā)點是一致的：我們都希望構(gòu)建一個更好的世界，讓人們更好地使用AI。”Richard Sutton稱。

免責(zé)聲明：本網(wǎng)信息來自于互聯(lián)網(wǎng)，目的在于傳遞更多信息，并不代表本網(wǎng)贊同其觀點。其內(nèi)容真實性、完整性不作任何保證或承諾。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益，請及時聯(lián)系我們，本站將會在24小時內(nèi)處理完畢。

同類資訊

大模型進展專欄第七期｜人工智能賦能科研范式重塑中國科學(xué)院 “磐石·科學(xué)基礎(chǔ)大模型”

博通發(fā)布Jericho4芯片：臺積電3nm工藝，可連接超100萬顆處理器

中山醫(yī)院獲批國家人工智能應(yīng)用中試基地建設(shè)項目，將打造醫(yī)療AI創(chuàng)新策源地

“人工智能場景化應(yīng)用創(chuàng)新與產(chǎn)業(yè)落地論壇”在哈爾濱舉行多領(lǐng)域創(chuàng)新成果集中亮相

以科技引領(lǐng)產(chǎn)業(yè)，繪人工智能發(fā)展新篇

向新而行｜人工智能的“頭雁”效應(yīng)

全站最新

鏖戰(zhàn)2025年，大模型圍著開源轉(zhuǎn)

“十四五”期間，我國5G用戶普及率從15%增至83.9%

舊金山一場停電，為什么馬斯克會“幸災(zāi)樂禍”？

魯豫對話鴻蒙開發(fā)者：把興趣寫進系統(tǒng)里的年輕人

熱門推薦

中東人工智能金融科技公司Alaan獲4800萬美元融資，助力企業(yè)智能化管理！

大模型進展專欄第七期｜人工智能賦能科研范式重塑中國科學(xué)院 “磐石·科學(xué)基礎(chǔ)大模型”

博通發(fā)布Jericho4芯片：臺積電3nm工藝，可連接超100萬顆處理器

美國證券交易委員會成立人工智能專責(zé)小組助力創(chuàng)新與效率提升

伊利諾伊州立法禁止人工智能提供心理健康服務(wù)

中山醫(yī)院獲批國家人工智能應(yīng)用中試基地建設(shè)項目，將打造醫(yī)療AI創(chuàng)新策源地

“人工智能場景化應(yīng)用創(chuàng)新與產(chǎn)業(yè)落地論壇”在哈爾濱舉行多領(lǐng)域創(chuàng)新成果集中亮相

國家安全部：警惕人工智能“數(shù)據(jù)投毒”

“人工智能+”覆蓋12個領(lǐng)域張家口人工智能應(yīng)用場景加速落地

推動區(qū)域人工智能技術(shù)應(yīng)用中科聞歌人工智能研發(fā)中心啟用

以科技引領(lǐng)產(chǎn)業(yè)，繪人工智能發(fā)展新篇

向新而行｜人工智能的“頭雁”效應(yīng)

警惕人工智能數(shù)據(jù)污染：0.01%虛假文本可使有害輸出增11.2%

庫克：從未對蘋果的產(chǎn)品規(guī)劃感到如此興奮

獨家對話中國聯(lián)通趙亞暉，AI時代的“數(shù)據(jù)燃料”是如何煉成的？ | 浪潮對話