AI新浪潮觀察
5min read
騰訊大模型「變陣」:成立 AI Infra 部,姚順雨出任首席 AI 科學(xué)家
連然2025/12/17
![]()
摘要
在混元 2.0 發(fā)布兩周后,騰訊大模型研發(fā)體系完成了一次關(guān)鍵的「系統(tǒng)升級(jí)」。
頭圖視覺中國(guó)
大模型戰(zhàn)事進(jìn)入深水區(qū),騰訊正在通過(guò)調(diào)整陣型,來(lái)適應(yīng)更快的速度。
12 月 17 日,騰訊宣布升級(jí)大模型研發(fā)架構(gòu)。這次調(diào)整最核心的變化在于成立了三個(gè)新部門:AI Infra 部、AI Data 部、數(shù)據(jù)計(jì)算平臺(tái)部 。
這是騰訊在混元大模型步入 2.0 時(shí)代后,對(duì)研發(fā)體系的一次全面「提速」。
在人事任命上,技術(shù)派高管被推向了更核心的位置。Vincesyao 出任「CEO/總裁辦公室」首席 AI 科學(xué)家,直接向騰訊總裁劉熾平匯報(bào);同時(shí),他還兼任新成立的 AI Infra 部及大語(yǔ)言模型部負(fù)責(zé)人,向技術(shù)工程事業(yè)群(TEG)總裁盧山匯報(bào)。
一手抓算法(大語(yǔ)言模型部),一手抓算力基建(AI Infra 部),同時(shí)直通公司最高決策層,這一配置表明:在騰訊的戰(zhàn)略棋盤中,大模型的研究與工程落地正在完成深度耦合。
姚順雨,98年的AI頂尖青年科學(xué)家
據(jù)了解,Vinces Yao就是數(shù)月前傳聞入職騰訊的姚順雨,畢業(yè)于清華和普林斯頓大學(xué),曾任OpenAI研究員。
據(jù)外媒報(bào)道,自今年 9 月從 OpenAI 離職加入騰訊以來(lái),姚順雨被高層賦予了極大的權(quán)限,以推動(dòng)內(nèi)部的文化與組織變革。過(guò)去幾個(gè)月里,騰訊一改往日在大模型人才戰(zhàn)中的守勢(shì),開始以雙倍薪資激進(jìn)地從字節(jié)跳動(dòng)等競(jìng)爭(zhēng)對(duì)手處挖角核心研究員,并為應(yīng)屆博士生開出高出行業(yè)標(biāo)準(zhǔn) 50% 的薪資溢價(jià)。
![]()
姚順雨10月在X上發(fā)帖|X
更深層的變化在于「權(quán)力交接」。騰訊正在進(jìn)行內(nèi)部重組,降級(jí)那些雖擅長(zhǎng)工程落地和廣告算法、但缺乏前沿 AI 研究背景的管理者,將指揮棒真正交還給「研究派」。這種去肥增瘦的動(dòng)作,旨在打破過(guò)去「產(chǎn)品經(jīng)理思維」主導(dǎo)大模型研發(fā)的局限。
姚順雨出生于1998年,是人工智能領(lǐng)域的頂尖青年科學(xué)家,本科畢業(yè)于清華大學(xué)計(jì)算機(jī)系(姚班),后赴普林斯頓大學(xué)攻讀計(jì)算機(jī)科學(xué)博士學(xué)位,2024年正式加入 OpenAI,專注于智能體(Agents)與深度研究(Deep Research)方向。
他在OpenAI任職及相關(guān)研究期間,主要在大模型推理、Agent(智能體)——及評(píng)估體系方面取得了核心成果:
提升推理能力:提出了著名的思維樹(Tree of Thoughts, ToT),通過(guò)讓大模型進(jìn)行多路徑推理和反復(fù)思考,大幅提升了模型解決復(fù)雜問題的能力;
智能體研究:他是 SWE-bench(大模型代碼能力評(píng)估數(shù)據(jù)集)和 SWE-agent(開源AI智能體)的關(guān)鍵貢獻(xiàn)者,并參與了 ReAct(推理與行動(dòng)結(jié)合)和 CoALA(智能體認(rèn)知架構(gòu))等開創(chuàng)性工作。
此外,他還在個(gè)人社交平臺(tái)發(fā)布了關(guān)于“AI 下半場(chǎng)”的思考,主張AI發(fā)展的重心應(yīng)從單純的訓(xùn)練轉(zhuǎn)向定義問題與評(píng)估,提出要像產(chǎn)品經(jīng)理一樣思考“解決什么問題”,認(rèn)為在當(dāng)前階段評(píng)估比訓(xùn)練更為重要。
為什么是 AI Infra?
在過(guò)去一年的「百模大戰(zhàn)」中,行業(yè)逐漸達(dá)成一個(gè)共識(shí):大模型的競(jìng)爭(zhēng),早已超越了單純的算法層面,變成了算力、數(shù)據(jù)、工程化能力的綜合比拼。
此次騰訊成立 AI Infra 部,也是為了解決「算力效率」這一關(guān)鍵命題。
據(jù)官方信息,AI Infra 部將作為騰訊大模型體系的重要一環(huán),聚焦于大模型分布式訓(xùn)練、高性能推理服務(wù)等核心技術(shù)。其目標(biāo)非常明確:構(gòu)建大模型 AI Infra 的核心競(jìng)爭(zhēng)力,為算法研發(fā)和業(yè)務(wù)場(chǎng)景落地提供穩(wěn)定、高效的技術(shù)底座。
這符合大模型技術(shù)演進(jìn)的規(guī)律——當(dāng)模型參數(shù)量級(jí)不斷躍升(如騰訊近期發(fā)布的混元 2.0),如何讓龐大的 GPU 集群高效運(yùn)轉(zhuǎn),如何在大規(guī)模并發(fā)下保證推理速度和成本,已經(jīng)成為決定生死的「隱形戰(zhàn)場(chǎng)」。
騰訊方面表示,在過(guò)往混元大模型的訓(xùn)練及海量業(yè)務(wù)實(shí)踐中,騰訊已積累了系統(tǒng)化的工程能力。此次獨(dú)立建制,意在進(jìn)一步強(qiáng)化這一優(yōu)勢(shì),提升 AI 大模型的整體研發(fā)效率。
除了算力基建,數(shù)據(jù)質(zhì)量和評(píng)測(cè)體系也被提到了新的高度。
此次升級(jí)中,新成立的 AI Data 部 將由劉煜宏負(fù)責(zé),專注于大模型數(shù)據(jù)及評(píng)測(cè)體系建設(shè);而數(shù)據(jù)計(jì)算平臺(tái)部則由陳鵬負(fù)責(zé),聚焦大數(shù)據(jù)和機(jī)器學(xué)習(xí)的數(shù)據(jù)智能融合平臺(tái)建設(shè)。兩人均向公司副總裁蔣杰匯報(bào)。
這意味著,數(shù)據(jù)處理不再只是算法研發(fā)中的附屬流程,而是作為獨(dú)立且關(guān)鍵的環(huán)節(jié)被標(biāo)準(zhǔn)化和制度化。
與此同時(shí),王迪將繼續(xù)擔(dān)任大語(yǔ)言模型部副總經(jīng)理,向姚順雨匯報(bào),確保模型算法團(tuán)隊(duì)與新成立的基礎(chǔ)設(shè)施部門保持緊密協(xié)同。
效率變革,從代碼到產(chǎn)品的「AI 化」
過(guò)去兩年,盡管擁有微信這樣的國(guó)民級(jí)應(yīng)用,騰訊在 AI 模型層卻一度被外界視為「旁觀者」。
一個(gè)標(biāo)志性事件是,今年 2 月騰訊元寶率先接入 DeepSeek R1。雖然這一動(dòng)作讓元寶的活躍用戶數(shù)實(shí)現(xiàn)了數(shù)量級(jí)躍升,但也給騰訊內(nèi)部敲響了警鐘:自有模型的缺位,甚至導(dǎo)致內(nèi)部部分業(yè)務(wù)團(tuán)隊(duì)因混元競(jìng)爭(zhēng)力不足而猶豫是否接入。
這種焦慮最終轉(zhuǎn)化為自上而下的壓力。據(jù)報(bào)道,騰訊總裁劉熾平今年早些時(shí)候曾對(duì)團(tuán)隊(duì)下達(dá)硬指標(biāo),要求必須在技術(shù)水位上趕超對(duì)手。此次變革,正是為了解決此前因組織分散導(dǎo)致的資源內(nèi)耗,集中力量為算法團(tuán)隊(duì)輸送「彈藥」。
架構(gòu)調(diào)整的最終目的,是為了支撐產(chǎn)品和業(yè)務(wù)的快速奔跑。
在前不久的 12 月 5 日,騰訊發(fā)布了混元 2.0,在預(yù)訓(xùn)練數(shù)據(jù)和強(qiáng)化學(xué)習(xí)策略上進(jìn)行了顯著改進(jìn),其 3D 模型甚至保持著全球領(lǐng)先水準(zhǔn),在開源社區(qū)下載量突破 300 萬(wàn)。
在應(yīng)用層,騰訊元寶上線初期保持了「一天一版本」的迭代頻率,目前用戶規(guī)模已穩(wěn)居國(guó)內(nèi) AI 應(yīng)用前三。而在騰訊內(nèi)部,一場(chǎng)靜水流深的 AI 效率變革正在發(fā)生:超過(guò) 90% 的騰訊工程師正在使用騰訊云代碼助手 CodeBuddy;50% 的新增代碼由 AI 輔助生成;代碼評(píng)審環(huán)節(jié)的 AI 參與度高達(dá) 94% 。
目前,騰訊混元大模型已在騰訊會(huì)議、微信、廣告、游戲等內(nèi)部超過(guò) 900 款應(yīng)用和場(chǎng)景中落地。
近期混元團(tuán)隊(duì)的高密度人才引進(jìn)與重組,本質(zhì)上正是為了支撐這種高強(qiáng)度的技術(shù)攻堅(jiān)與業(yè)務(wù)滲透 。通過(guò)成立 AI Infra 等新部門,騰訊正在試圖打通從底層算力、數(shù)據(jù)處理到上層算法、應(yīng)用落地的任督二脈,為接下來(lái)的 AI 長(zhǎng)期競(jìng)賽備好糧草。
騰訊大模型混元





京公網(wǎng)安備 11011402013531號(hào)