紅星資本局11月12日消息,前DeepSeek研究員羅福莉加入小米。
![]()
圖據“羅福莉”微信公眾號
11月12日,據澎湃新聞報道,羅福莉在朋友圈發文:“智能終將從語言邁向物理世界。我正在Xiaomi MiMo,和一群富有創造力、才華橫溢且真誠熱愛的研究員,致力于構建這樣的未來,全力奔赴我們心目中的AGI。”
值得注意的是,今年10月,小米AI團隊攜手北京大學聯合發布一篇聚焦MoE與強化學習的論文,其中已經出現羅福莉的名字。
Xiaomi MiMo是小米首個推理大模型。這也是羅福莉正式宣布自己已經加入小米,亦是對此前傳言的回應。
2024年底,DeepSeek發布了新一代大語言模型DeepSeek-V3,同時宣布開源。該模型在AI圈爆火后,DeepSeek-V2的關鍵開發者之一羅福莉走進大眾視野,被稱為95后AI“天才少女”。
公開資料顯示,羅福莉本科就讀于北京師范大學計算機專業,碩士畢業于北京大學計算語言學專業。
碩士畢業后,羅福莉先是進入阿里達摩院做人工智能研究,從事預訓練語言模型相關的工作,負責阿里達摩院AliceMind開源項目,主導開發了多語言預訓練模型VECO。2022年,羅福莉加入幻方量化從事深度學習相關策略建模和算法研究,后又跳槽到DeepSeek擔任深度學習研究員,參與研發MoE大模型DeepSeek-V2。
就在DeepSeek-V3發布前幾天,小米創始人雷軍已開出千萬元年薪招聘羅福莉,領導小米AI大模型團隊。
當時有消息稱,小米公司正在積極搭建自己的GPU萬卡集群,以加大對AI大模型的投入力度。小米大模型團隊在成立之初就已擁有6500張GPU資源,而此次搭建GPU萬卡集群,將進一步提升小米在AI大模型領域的研發實力。據知情人士透露,該計劃已經實施數月之久,雷軍在其中扮演了重要的領導角色。他對于AI硬件的重視程度極高,認為手機是AI硬件領域的核心,小米必須全力以赴。
據Xiaomi MiMo公眾號消息,今年4月,小米開源了首個為推理(Reasoning)而生的大模型“Xiaomi MiMo”。
![]()
據Xiaomi MiMo公眾號
文章稱,在數學推理(AIME 24-25)和代碼競賽(LiveCodeBench v5)公開測評集上,MiMo僅用7B的參數規模,超越了OpenAI的閉源推理模型o1-mini和阿里Qwen更大規模的開源推理模型 QwQ-32B-Preview。
MiMo是全新成立不久的小米大模型Core團隊的初步嘗試。小米大模型Core團隊稱,“2025年雖看似是大模型逐夢的后半程,但堅信AGI的征途仍漫長。我們將從務實創新出發,勇敢探索未知,用思考突破智能邊界,用創造回應每一次好奇。”
(本文不構成任何投資建議,據此操作風險自擔)
編輯 楊程 部分綜合自大象新聞、澎湃新聞、公開資料
審核 官莉





京公網安備 11011402013531號