時(shí)令 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
太尷尬了。
就在周末,GPT-5又雙叒帶來(lái)了數(shù)學(xué)方面的新突破,一道難題被宣稱解決…
然鵝……很快就被發(fā)現(xiàn)是OpenAI的“營(yíng)銷過(guò)度”,小題大作,根本算不上什么突破。
友商大咖們也都不裝了。
DeepMind CEO哈薩比斯貼臉熱嘲得很直接:太尷尬了吧。
目前仍然供職于meta的LeCun,吐起別人槽點(diǎn)時(shí)天賦全開(kāi)——

目前:OpenAI方面已經(jīng)把“大新聞”刪除了。

GPT-5又搞出數(shù)學(xué)“大突破”
這一切的一切,還得從OpenAI研究員Mark Sellke在X上的一條推文說(shuō)起。
Mark高調(diào)宣布GPT-5在數(shù)學(xué)上取得了重大突破。他們借助GPT-5成功找到了10個(gè)著名的厄爾多斯數(shù)學(xué)難題(Erd?s problems)的解法,還興奮表示到:
經(jīng)過(guò)數(shù)千次GPT-5的查詢,我們發(fā)現(xiàn)了10個(gè)原本還處于“未解狀態(tài)”的厄爾多斯難題的解答,分別是223、339、494、515、621、822、883(第二部分)、903、1043、1079。
此外,還有11個(gè)難題取得了重要的部分進(jìn)展,并更新到了官網(wǎng)上。甚至在第827題上,我們還發(fā)現(xiàn)厄爾多斯本人原始論文里存在錯(cuò)誤,這個(gè)錯(cuò)誤由Martínez和Roldán-Pensado兩位學(xué)者后來(lái)進(jìn)行了修正。看來(lái),未來(lái)的科學(xué)研究真的要變得有趣了!

甚至連OpenAI高管Kevin Weil也在X上驚呼:
GPT-5 找到了10個(gè)此前未解決的Erd?s問(wèn)題的解答,并在另外11個(gè)問(wèn)題上取得進(jìn)展。
隨后,OpenAI另一名知名研究員Sebastien Bubeck也興奮地轉(zhuǎn)發(fā)并補(bǔ)充道:
AI驅(qū)動(dòng)的科學(xué)加速時(shí)代正式開(kāi)啟了!兩位研究員僅靠一個(gè)周末、借助GPT-5成功解開(kāi)10個(gè)厄爾多斯難題。
消息一出,全網(wǎng)震動(dòng),一時(shí)間不少人誤以為GPT-5獨(dú)立破解了這些困擾數(shù)學(xué)界數(shù)十年的難題。
但事情真這么簡(jiǎn)單嗎?
哈薩比斯Lecun貼臉熱嘲
這場(chǎng)歡呼很快被谷歌DeepMind CEO哈薩比斯狠狠潑了一盆冷水。哈薩比斯直接在Bubeck推文底下回復(fù)道:
這真是尷尬啊!

咦?不是重大數(shù)學(xué)突破嗎?咋還尷尬上了呢?
這時(shí),哈薩比斯冷靜地引導(dǎo)大家去查看Thomas Bloom發(fā)布的一則關(guān)鍵說(shuō)明。
這里值得一提的是,Thomas正是OpenAI引用的那個(gè)erdosProblems.com網(wǎng)站的創(chuàng)始人兼維護(hù)人。
Thomas澄清到:
作為erdosproblems .com網(wǎng)站的擁有者和維護(hù)者,我得聲明:OpenAI的說(shuō)法明顯夸大了事實(shí)。GPT-5只是通過(guò)網(wǎng)絡(luò)搜索,找到了早已存在的論文,這些論文中早就解答了這些問(wèn)題,只是我個(gè)人不知道而已。網(wǎng)站上的“未解”狀態(tài)只是說(shuō)明我尚未發(fā)現(xiàn)相關(guān)的論文,而不代表全世界數(shù)學(xué)界沒(méi)有解決方案。

簡(jiǎn)單來(lái)說(shuō),就是GPT-5實(shí)際上并沒(méi)有獨(dú)立地破解任何厄爾多斯難題。它所做的僅僅是比人類網(wǎng)站管理員更迅速地在互聯(lián)網(wǎng)上檢索到了已知的答案,而這些答案其實(shí)早已存在。
事后,Bubeck刪除了之前的推文:
我刪除了之前的推文,我顯然不是有意誤導(dǎo)任何人,我原本以為自己的表達(dá)很清楚,對(duì)此感到抱歉。我們僅僅是發(fā)現(xiàn)了已經(jīng)發(fā)表在文獻(xiàn)中的解法,僅此而已。我認(rèn)為這依然是一種巨大的進(jìn)步,因?yàn)槲抑罊z索文獻(xiàn)有多么困難。

LeCun也在下面回復(fù):
這次他們被自己吹噓GPT的言論坑慘了.

(梗注:原文為“Hoisted by their own GPTards”,源自英文俗語(yǔ) “hoisted by their own petard”,意指“搬起石頭砸自己的腳”,這里被LeCun改為GPTards,以諷刺那些盲目吹捧GPT的人。)
但話說(shuō)回來(lái),這次的烏龍事件也不是平白無(wú)故就發(fā)生的……
畢竟在解數(shù)學(xué)題方面,GPT-5的過(guò)往戰(zhàn)績(jī)確實(shí)有跡可循。
GPT-5有點(diǎn)數(shù)學(xué)能力在身上
在國(guó)慶期間,陶哲軒就用GPT-5解決數(shù)學(xué)難題:
序列l(wèi)cm(1,2,…,n)是否是高度豐數(shù)的一個(gè)子集?
天才甚至直言不諱地表示:
如果沒(méi)有AI幫忙,完成同樣任務(wù)就需要花費(fèi)數(shù)小時(shí)(主要是手動(dòng)編寫(xiě)代碼和調(diào)試)。
甚至難如量子復(fù)雜性理論,它也能在不到半小時(shí)內(nèi)給出關(guān)鍵證明思路。
就在上個(gè)月,GPT-5還在數(shù)學(xué)教授引導(dǎo)下,首次將定性的第四矩定理擴(kuò)展為帶有顯式收斂率的定量形式。

這一樁樁,一件件,GPT-5的能力確實(shí)不容小覷。
而此次烏龍事件的關(guān)鍵原因就在于:宣傳的發(fā)言模棱兩可,讓人們誤以為GPT-5真的自主解決了非常難的數(shù)學(xué)題。
更糟糕的是,這種誤導(dǎo)性的說(shuō)法還被自家人進(jìn)一步夸大宣傳,才造成了如此尷尬的局面。
當(dāng)然,也有其他網(wǎng)友殺人誅心,主要還是GPT-5太拉胯了——越差勁越想證明自己優(yōu)秀。

還有人拿出了卡帕西最新火爆的訪談?wù)摂啵?/p>

總而言之,AI帶來(lái)轟動(dòng)大進(jìn)展的節(jié)奏似乎正在過(guò)去,或者說(shuō)大眾已經(jīng)開(kāi)始對(duì)AI突破脫敏了,如果不是真正的大突破大進(jìn)展,總想搞個(gè)大新聞,還是容易出偏差的…
參考鏈接:
[1]https://the-decoder.com/leading-openai-researcher-announced-a-gpt-5-math-breakthrough-that-never-happened/
[2]https://x.com/dotey/status/1979640848041071097?s=46&t=fzKJptGJMpr-yj3MUXd6HA
[3]https://x.com/demishassabis/status/1979417877590774063
https://x.com/ylecun/status/1979595060447416733
一鍵三連「點(diǎn)贊」「轉(zhuǎn)發(fā)」「小心心」
歡迎在評(píng)論區(qū)留下你的想法!
— 完 —





京公網(wǎng)安備 11011402013531號(hào)