
![]()
“云端之外,端側(cè)AI也是國產(chǎn)芯片下一個主戰(zhàn)場。”
作者丨趙之齊
編輯丨包永剛
2025年12月12-13日,第八屆GAIR全球人工智能與機器人大會在深圳·博林天瑞喜來登酒店正式啟幕。
作為AI產(chǎn)學(xué)研投界的標(biāo)桿盛會,GAIR自2016年創(chuàng)辦以來,始終堅守“傳承+創(chuàng)新”內(nèi)核,始終致力于連接技術(shù)前沿與產(chǎn)業(yè)實踐。
在人工智能逐步成為國家競爭核心變量的當(dāng)下,算力正以前所未有的速度重塑技術(shù)路徑與產(chǎn)業(yè)結(jié)構(gòu)。13日舉辦的“AI算力新十年”專場聚焦智能體系的底層核心——算力,從架構(gòu)演進、生態(tài)構(gòu)建到產(chǎn)業(yè)化落地展開系統(tǒng)討論,試圖為未來十年的中國AI產(chǎn)業(yè),厘清關(guān)鍵變量與發(fā)展方向。
IO資本創(chuàng)始合伙人趙占祥,專注于硬科技與半導(dǎo)體領(lǐng)域的早期及成長期投資,在大會上,他發(fā)表了題為《大模型時代,國產(chǎn)AI芯片破局的幾種新技術(shù)路線》 的演講。
![]()
長期關(guān)注半導(dǎo)體與硬科技的他,近幾年密切觀察著國產(chǎn)AI芯片在現(xiàn)實約束下的演進路徑。“今年國產(chǎn)GPU的市場占有率已接近一半,在先進制程受限的背景下,單純沿著GPU的既有路線繼續(xù)追趕英偉達,必須依靠新的技術(shù)路徑”,他開宗明義。
從這一判斷出發(fā),趙占祥系統(tǒng)梳理了過去一年國內(nèi)涌現(xiàn)出的多條探索路線,覆蓋云端、邊緣、端側(cè)、IoT末端以及先進封裝等多個層面。
云端方向,趙占祥重點提到TPU、Hybrid Bonding(混合鍵合)、大容量SRAM推理芯片以及大規(guī)模分布式互聯(lián)等方案。這些路線的共同點,是繞開對HBM和先進工藝的高度依賴,通過系統(tǒng)設(shè)計獲得整體性能提升。“英偉達自己流片的成本只占四分之一,一半的成本在HBM上”,他說,“如果帶寬能上去,本質(zhì)上就是用存力去抵消算力不足。”
在他看來,許多值得關(guān)注的變化,也正發(fā)生在端側(cè)和末端。除了在演講中梳理多條新興端側(cè)芯片路線外,趙占祥在演講結(jié)束后也與雷峰網(wǎng)展開對談,進一步解釋了他為何在格外看重端側(cè)市場,以及這些方向如何在現(xiàn)實約束下跑通商業(yè)閉環(huán)。(作者長期關(guān)注半導(dǎo)體、算力上下游等方向,歡迎添加微信Ericazhao23交流。)
01
對話:
端側(cè)芯片市場大,工程師紅利是商業(yè)閉環(huán)關(guān)鍵
雷峰網(wǎng):您在演講中分享了很多端側(cè)AI的案例,為什么今年著重看端側(cè)芯片市場?
趙占祥:接下來AI技術(shù)要真正落地,就要靠端側(cè)。這個市場未來規(guī)模肯定也是海量,全球PC與平板的出貨量大約四億臺、手機十幾億臺,這些都是端側(cè)芯片巨大需求的基礎(chǔ)。
更重要的是,AI硬件未來的機會是中國的。
軟件生態(tài)的客戶群體集中在國內(nèi),這給中國芯片廠商創(chuàng)造了天然優(yōu)勢。就像藍牙耳機領(lǐng)域——中國占據(jù)全球90%的市場份額,核心芯片也幾乎都是中國廠商供應(yīng)。這種生態(tài)邏輯和Arm很相似,可以說,如果沒有中國廠商,就沒有今天Arm的產(chǎn)業(yè)影響力。
雷峰網(wǎng):但有一種說法認(rèn)為,部分端側(cè)芯片的出貨量有限、成本利潤又比較低,難以覆蓋生產(chǎn)成本。那么,端側(cè)芯片想實現(xiàn)商業(yè)閉環(huán),重點會在什么地方?
趙占祥:可以看看瑞芯微的例子,他們現(xiàn)在利潤表現(xiàn)很好,核心就是過去十年里,把服務(wù)做到了極致。比如,他們能做到無原廠接入的情況下直接替換,所以大家在深圳想做AI硬件,會優(yōu)先想到瑞芯微。他們各種解決方案都有,這種重服務(wù)的模式就是中國工程師紅利的體現(xiàn)。
美國廠商就做不到這一點,他們更擅長把開發(fā)平臺打磨到極致,但服務(wù)能力弱;中國廠商或許在性能上稍遜色,但能通過深度適配滿足不同產(chǎn)品需求,這種落地能力在AI商業(yè)化階段,反而成了核心優(yōu)勢,可以通過“堆人”做好服務(wù)。
雷峰網(wǎng):目前來說,端側(cè)芯片的發(fā)展主要面臨什么瓶頸?
趙占祥:首先是功耗,當(dāng)前的AI手機芯片是跑不了大模型的,算力不夠、存儲容量不夠,大模型對內(nèi)存的消耗還是太大了,這也是為什么現(xiàn)在光羽芯辰和微納核芯在推PIM+3D DRAM的方案,就是通過存內(nèi)計算,讓內(nèi)存直接承擔(dān)計算任務(wù)、再用3D堆疊封裝提升存儲容量,也能降低整體功耗。
不過,除了技術(shù)還有生態(tài)的能力。對新入局的NPU創(chuàng)業(yè)公司來說,手機生態(tài)的壁壘太高了:華為有自己的芯片生態(tài),小米、OPPO高端機主要用高通芯片,vivo X系列高端機用聯(lián)發(fā)科,這些新NPU公司怎么和主芯片廠商建立合作,是很重要的。
雷峰網(wǎng):預(yù)計明年在端側(cè)這邊,會有哪些應(yīng)用能率先規(guī)模化落地嗎?
趙占祥:現(xiàn)在末端AI的形態(tài),主要是指環(huán)、眼鏡等可穿戴設(shè)備,還有各類傳感器和智能家居、AI硬件。不過,接下來爆發(fā)力最強的多模態(tài)AI硬件應(yīng)該就是AI眼鏡了,明年大概率會迎來銷量暴漲,保守估計能賣幾千萬部,核心驅(qū)動力就是成本下降。
目前已有中國廠商在日本賣的一款智能眼鏡,售價才幾十塊錢,雖然只是加上個耳機功能,但銷量非常大。未來AI眼鏡的發(fā)展路徑,應(yīng)該是“先降成本、再升體驗”,未來AI眼鏡完全有可能降到普通眼鏡的價格,就像現(xiàn)在買個太陽鏡只要一百塊錢那樣。
雷峰網(wǎng):那在末端AI這邊,要實現(xiàn)商業(yè)閉環(huán)會有哪些比較可行的路徑?
趙占祥:末端最后應(yīng)該也會跑出極致低功耗的AI芯片公司,或者Arm這樣的IP供應(yīng)商。比如智源匠芯,就是賣IP授權(quán)的,做SoC、電源管理、傳感器、MCU等芯片的廠商可以買他們的IP集成進去,這種IP的伸縮性特別好,能支撐起完整的生態(tài)供應(yīng)鏈。
而且,IP模式之所以能形成閉環(huán),關(guān)鍵在于“量大”。低功耗AI IP成本很低,芯片公司如果自己研發(fā),不僅要花錢招人,效果還未必好,直接采購反而更劃算。就像藍牙耳機芯片一年出貨三十億顆,哪怕每顆收一毛錢授權(quán)費,也能有三個億的收入了。
![]()
02
演講全文
精彩演講回顧
以下是趙占祥演講的精彩內(nèi)容,雷峰網(wǎng)作了不改變原意的整理與編輯:
前面幾位嘉賓主要分享了國產(chǎn)GPU的發(fā)展路徑。正如剛才羅總提到的,今年國產(chǎn)GPU的市場占有率已接近一半。在先進制程受限的背景下,單純沿著GPU的既有路線繼續(xù)追趕英偉達,很難在性能上超越英偉達,所以必須依靠新的技術(shù)路徑。
自去年起,國內(nèi)又涌現(xiàn)了一二十家創(chuàng)新的芯片公司,嘗試通過新的架構(gòu)設(shè)計和工藝路線,探索大模型時代AI芯片的發(fā)展方向。今天,我將圍繞這些技術(shù)路線展開分享。
首先我們回顧下美國對華出口管制的演進。
2022至2024年間,相關(guān)限制“變本加厲”,核心集中在先進計算與先進制程領(lǐng)域,包括光刻機、HBM、先進封裝,還有混合鍵合和人員流動限制等關(guān)鍵環(huán)節(jié)。在這樣的環(huán)境下,中國要依賴EUV工藝向2nm等先進制程演進,難度還是很大的。
我也列一下國內(nèi)在不同方向上的創(chuàng)新技術(shù)路線,包括云端的AI芯片、邊緣的AI芯片、端側(cè)的AI芯片、IoT末端的AI芯片和先進封裝。中國真正強的是,我們可以把應(yīng)用做好,有工程師紅利,我們在各個領(lǐng)域都有不同的定制化方案和創(chuàng)新的解決路線。
![]()
三大路線破制程限制:TPU、Hybrid Bonding、SRAM
首先,是數(shù)據(jù)中心的AI芯片。
第一條路線,是超維無際的TPU路線。Google最新發(fā)布的Gemini3模型,就是基于TPU進行訓(xùn)練。目前,包括OpenAI、Anthropic、xAI在內(nèi)的多家AI巨頭,已向Google下單采購TPU。現(xiàn)在Google正式對外銷售TPU芯片了,已經(jīng)是全球出貨量僅次于英偉達的AI芯片產(chǎn)品。
TPU的核心特征在于以“超節(jié)點性能”為目標(biāo),而非單卡性能。其優(yōu)勢包括更大規(guī)模的超節(jié)點架構(gòu)、更高性價比,以及相對友好的軟件生態(tài)。在不依賴CUDA的前提下,通過系統(tǒng)級設(shè)計獲得整體性能提升,同時減少對先進制程、HBM以及NV/IBSwitch的依賴,從而顯著降低成本——甚至達到遠(yuǎn)超英偉達十倍以上的超高性價比。
之后,是算苗科技的3D-TokenPU,這條路線的核心在于Hybrid Bonding(混合鍵合)技術(shù)。進入大模型時代后,對數(shù)據(jù)存儲的要求是更高的。其實英偉達自己流片的成本只占1/4,1/2的成本則花在HBM上。如果我們用Hybrid Bonding的方式,相比HBM的帶寬是更高的,現(xiàn)在HBM的帶寬就是幾個TB/s,等于是用存力抵消了算力不足的問題。
第三,是芯感未來的大容量SRAM推理芯片。這個方案以SRAM為核心,相比于GPGPU,具備三項顯著優(yōu)勢:
低時延,可實現(xiàn)毫秒級響應(yīng);低成本,單位性能成本相比傳統(tǒng)GPGPU提高了10倍;低功耗,無需HBM,也不依賴先進制程,從而顯著降低制造難度和能耗。
接下來,是比特智路的百萬卡分布式互聯(lián)方案。在超大規(guī)模集群中,網(wǎng)絡(luò)成為關(guān)鍵瓶頸,傳統(tǒng)無損網(wǎng)絡(luò)在萬卡規(guī)模下可用性下降明顯。比特智路就采用基于以太網(wǎng)、允許丟包的互聯(lián)方案,使系統(tǒng)具備更強的可擴展性,有望支持百萬卡級別的分布式集群。
再來看看邊緣芯片的發(fā)展。
![]()
首先,英偉達近期發(fā)布Spark AI Station,搭載GB10芯片。未來家庭場景中,NAS有可能從單純的存儲中心演進為計算中心,就都要配一個邊緣AI芯片。攝像頭等設(shè)備也會從被動監(jiān)控變成主動認(rèn)知,自然就需要大模型的計算能力,這一變化為國產(chǎn)方案提供了落地優(yōu)勢。
Nanotrix公司提出的LPU架構(gòu),采用四層3D DRAM堆疊,內(nèi)存帶寬可達24TB/s。GB10處理的Token在每秒個位數(shù),但這個相比傳統(tǒng)方案,其Token處理能力可以達到每秒上百個。
在機器人等領(lǐng)域,當(dāng)前芯片仍是被英偉達Orin壟斷的,國產(chǎn)芯片目前最大的問題就是算力沒有那么高,用得最多的瑞芯微只有幾個TOPS,智能體的GPU算力可以做得更高。
存算一體+三維架構(gòu),跑通端側(cè)AI芯片的“不可能三角”
而端側(cè)AI芯片,主要是手機以及各種智能終端。
首先是燁知芯路線,他們走的是蘋果NPU路線。蘋果的NPU從2017年開始做,做到現(xiàn)在8年的時間了,迭代了很多代,已經(jīng)是很成功的NPU了。
它的優(yōu)勢在于強通用性,能支持所有AI網(wǎng)絡(luò);其次是高能效比,蘋果的NPU已經(jīng)不需要比參數(shù)了,它的能耗比相比于傳統(tǒng)的CPU和GPU,有10倍以上的優(yōu)勢,相比其他的AI芯片,面積只有1/2至1/4。
此外,還有高效編譯器以及良好的可擴展性。所以蘋果主要是易用性做得非常好,而不是一味地追求算力的性能和參數(shù)。
之后,是光羽芯辰的端側(cè)AI芯片,這也是燧原參與的一家公司。他們用的是3D DRAM+PIM。3D DRAM是堆疊封裝的技術(shù),而 PIM 在此基礎(chǔ)上引入計算邏輯,使端側(cè)設(shè)備在更小面積、更低成本和功耗條件下實現(xiàn)更高算力。
![]()
微納核芯則采用了全球首創(chuàng)的三維存算一體3D-CIM架構(gòu),兼顧了高性能、低功耗與低成本這個“不可能三角”。在存儲芯片中引入計算邏輯,相當(dāng)于將NPU核心直接集成至DRAM中。這樣做的優(yōu)勢在于,手機系統(tǒng)無需額外增加AI芯片,內(nèi)存芯片本身即可承擔(dān)計算功能,與CPU協(xié)同工作,整體芯片數(shù)量不增加,功耗較低,Token生成能力可達每秒百級。
還有一種方案,是韌槃科技的 LPDDR-PIM方案,能夠?qū)崿F(xiàn)高帶寬、低功耗。在DDR的DRAM里面,每個Bank旁邊放了一個計算板塊,合起來之后,帶寬可以做到1-2TB/s,在手機上可以跑30-70億大模型。
接下來,是末端AI芯片。
末端AI芯片的核心訴求是超低功耗處理能力。
例如,智源匠芯做的是模型、架構(gòu)與電路多層協(xié)同的“深度自適應(yīng)”處理器核,推出兩類產(chǎn)品:一類為mW(毫瓦)級功耗,可實現(xiàn)10–300 GOPS;另一類為μW(微瓦)級功耗,面向?qū)δ芎囊髽O致的應(yīng)用場景,算力可達幾個GOPS。例如在關(guān)鍵傳感器等場景中,可直接集成該類AI核。
此外,3D DRAM的發(fā)展高度依賴先進封裝。最近我看到一家深圳的公司,他們就是做先進封裝設(shè)備核心零部件的,現(xiàn)在整個產(chǎn)能都拉滿了。芯片公司讓先進封裝廠擴產(chǎn),先進封裝廠讓設(shè)備公司擴產(chǎn),設(shè)備公司讓上游模塊廠商、組件廠商擴產(chǎn),整個產(chǎn)業(yè)鏈從前幾年的無人問津、到現(xiàn)在產(chǎn)能拉爆,明年的產(chǎn)能還會更加緊張。甚至,有些設(shè)備廠商的訂單都已經(jīng)排到了明年下半年,整個行情都被AI算力帶起來了。
在先進封裝需求推動下,又有一些新的機會涌現(xiàn)。
比如,電容、電感等器件,傳統(tǒng)電容電感主要部署在PCB板上,占用面積較大;而在先進封裝中,這些器件需要內(nèi)嵌至芯片內(nèi)部,只能采用硅電容方案,應(yīng)用于高性能SoC、AI算力芯片及高速光模塊里面,所以硅電容未來的需求是很巨大的。
以蘋果電腦為例,單個主芯片需要的硅電容數(shù)量可達8–11顆,用量非常大。相關(guān)核心技術(shù),包括半導(dǎo)體MOS工藝、3D納米結(jié)構(gòu)、深溝式技術(shù)及高容積率PICS技術(shù)。以前放在PCB板上,器件壞了之后把它拿下來換一下就可以了,但現(xiàn)在不可能把芯片拆了拿出來換,可靠性要求更高,門檻相比之前高了很多。
齊力半導(dǎo)體是一家從事先進封裝產(chǎn)線的公司,產(chǎn)品涵蓋2.5D與3D封裝,其中3D封裝就是在2.5D的基礎(chǔ)上引入了TSV技術(shù)。
在混合鍵合技術(shù)下,可以實現(xiàn)數(shù)十至數(shù)百TB級別的帶寬能力,這也對檢測設(shè)備提出了更高要求。過去檢測設(shè)備主要服務(wù)于先進制程,但當(dāng)前先進封裝需求快速增長,對微凸塊3D檢測和全流程缺陷檢測提出了更高要求——這么多顆芯片里,一旦焊接或鍵合存在缺陷,可能導(dǎo)致多顆芯片同時報廢,成本極高。隨著堆疊層數(shù)增加,良率下降問題更加突出,就只能依賴高精度檢測設(shè)備保證質(zhì)量,以此控制成本。
而在3D封裝中,層間焊接之間如果有空隙,就難以通過電子束、光學(xué)或X射線檢測發(fā)現(xiàn),往往需要依賴超聲波檢測技術(shù)。這項技術(shù)在晶圓鍵合領(lǐng)域的應(yīng)用范圍正在擴大,國內(nèi)的思波微也已經(jīng)推出用于先進封裝的超聲檢測設(shè)備。
![]()
再介紹一下光電合封,它被認(rèn)為是下一代AI算力的基石。與傳統(tǒng)光模塊方案相比,其在功耗、集成度、可靠性和部署效率方面具備明顯優(yōu)勢。具體來看,功耗可以降低約3.5倍,集成度提升約63倍,可靠性提升約10倍,部署時間縮短約1.3倍。國內(nèi)已經(jīng)有企業(yè)在該方向開展產(chǎn)品布局。
最后簡單介紹IO資本。IO資本是一家長期專注于硬科技領(lǐng)域的財務(wù)顧問機構(gòu)。這一頁展示的是近年來已完成上市的項目,后續(xù)也有多家企業(yè)正在推進上市進程。目前,我們所服務(wù)和陪伴的硬科技獨角獸企業(yè)數(shù)量已超過30家,這里列舉了一些代表性案例。
![]()





京公網(wǎng)安備 11011402013531號