編輯部 整理自 凹非寺量子位 | 公眾號 QbitAI
Agent的真正價值不在于演示效果多驚艷,而在于能否真正跑在生產環境里。 數據顯示,超過93%的企業Agent項目卡在了從POC(概念驗證)到生產的最后一公里。在量子位MEET2026智能未來大會上,亞馬遜云科技大中華區產品部總經理陳曉建系統闡述了企業級Agent從開發到生產的完整路徑。
這個數字背后,是無數企業在Agent落地過程中踩過的坑:開發門檻高、工程化能力缺失、模型定制困難、安全邊界模糊。
![]()
在剛剛結束的AWS re:Invent 2025大會上,亞馬遜云科技將聚光燈對準了Agent。不是因為其他技術不重要,而是整個行業都意識到:Agent正在成為AI生產力釋放的關鍵樞紐。
陳曉建的分享,正是圍繞“如何讓Agent真正跑起來”這一核心命題展開。
MEET2026智能未來大會是由量子位主辦的行業峰會,近30位產業代表與會討論。線下參會觀眾近1500人,線上直播觀眾350萬+,獲得了主流媒體的廣泛關注與報道。
核心觀點梳理
一個成功的Agent需要三個模塊:模型(大腦)、代碼(邏輯)、工具(連接物理世界的手腳)。三者的有效連接是最大的工程挑戰。十幾行代碼實現過去數千行才能完成的功能,這就是模型驅動開發帶來的效率躍遷。93%的Agent項目卡在POC到生產的跨越上,核心原因是數據質量落差和工程化能力缺失。模型定制的最佳時機是在基礎模型訓練階段,就像人類學習語言,年幼時效果遠好于成年后。對Agent既不能嚴防死守,也不能過度放任,正確做法是通過策略框架劃定行為邊界。
以下為陳曉建演講全文:
Agent成功的三要素:模型、代碼與工具
Agent正在從各個維度釋放AI的生產力潛能,它可以替代許多人類以往的工作,甚至能夠完成人類此前無法企及的任務。然而從創意到落地,中間需要跨越的鴻溝遠比想象中更寬。
我們認為,一個成功的Agent需要三個至關重要的模塊。
第一是底層模型。
模型是Agent的大腦,負責產生智慧、提供決策,承擔推理、規劃與執行的核心職能。
第二是代碼。
任何Agent都需要服務于特定場景,提供該場景所需的功能邏輯。這些邏輯需要像構建傳統軟件一樣,通過代碼來實現。這一點與大多數已有軟件并無本質區別。
第三是工具。
如果把模型比作大腦,那么工具就是連接大腦與物理世界的手和腳。在整個架構中,工具層包括連接不同信息源的各類協議,以及執行各種行為的代碼——比如知識庫、數據庫、代碼庫,或者瀏覽器等外部能力。
當然,我們看到很多客戶在嘗試用自己的方式構建Agent。但如何有效連接這三個模塊,帶來了巨大的復雜性與挑戰。如何高效調用模型能力?如何組織代碼邏輯?如何打通與物理世界的連接?不同工具之間的編排,更是給開發者帶來了前所未有的新課題。
十幾行代碼完成過去數千行的工作
基于這些挑戰,我們從2024年開始規劃:如何構建一套工具,降低開發者構建Agent的門檻?如何讓工具編排更加自動化?如何讓大模型調用更加便捷?
今年,我們正式推出了Strands Agents
Strands Agents采用模型驅動的方法論,讓大語言模型能夠自主處理各種場景,從而大幅簡化開發Agent所需的代碼量。我們經常收到客戶反饋:過去需要數千行代碼才能開發的場景,現在只需要短短十幾行就能實現
在推出Strands Agents時,我們就將其定位為一個開源項目。用戶不僅可以直接使用,還可以獲取完整源碼。更重要的是,Strands Agents采用開放架構,不僅適配亞馬遜云科技自身的產品,也兼容業界各種流行的開源或商用框架。
在上周的re:Invent大會上,我們同步發布了兩項重要更新。
一是支持Typescript語言。Typescript是業界廣泛使用的編程語言,通過支持這一語言,可以幫助更多開發者構建更適用的Agent方案。
二是支持邊緣設備部署。邊緣設備正日益成為人類生活與工作不可分割的一部分,Strands Agents可以為汽車、游戲、機器人等各類終端提供Agent能力,讓Agent不僅能在云端運行,也能在前端智能設備上運行。
93%的項目卡在POC到生產的跨越上
除了開發工具,我們還看到大量客戶在Agent的部署與上線階段遭遇困難。
有一組來自第三方調研的數據值得關注:93%的客戶在從POC階段邁向生產階段時遇到了重大障礙。換言之,可能只有不到10%的客戶能夠真正將Agent從POC推進到最終生產環境。
原因是什么?
POC與生產環境之間存在本質差異。在POC階段,我們可能只需要關注代碼效果如何。但到了生產階段,很多客戶發現,原先在POC階段表現優異的效果突然變得不盡如人意。
一個重要原因是數據。在POC階段,數據可以經過精心挑選,保證高質量。但在真實生產環境中,數據是無法被人為篩選和優化的。數據質量的落差,往往是POC與生產效果差異的核心原因。
另一個主要原因是工程化挑戰。一旦業務從POC走向生產,就必須直面一系列生產環境特有的問題:安全、擴容、成本、高可用……這些問題在POC階段完全不需要考慮,但上了生產就必須正視。
正是基于這些考量,我們意識到:不僅要提供降低編程門檻的開發工具,還需要提供工程化能力,幫助客戶跨越從POC到生產的鴻溝。
這就是我們在2025年7月推出Amazon Bedrock AgentCore的原因。
AgentCore是一個完整的工具箱,提供多種能力幫助客戶實現底層基礎架構的編排。當您的Agent部署上云時,無需關心底層的計算資源、網絡資源、安全配置、可觀測性如何實現——AgentCore會幫您完成這些底層資源的動態管理。這將極大地幫助客戶解決從POC到生產過程中遇到的工程化難題。
模型定制:在“年幼時”學習效果最好
當Agent進入生產環境后,還會面臨一系列效率問題:延遲、可擴展性、敏捷性……這些都是實際生產中必須關注的特性。如果延遲從幾百毫秒飆升到秒級以上,用戶體驗會受到極大影響;如果可擴展性不足,業務高峰期同樣會出現瓶頸。
這里要談談模型定制的挑戰。
在很多場景下,通用大模型在標準場合表現出色,但在特定垂直場景中可能無法滿足需求。因此,許多客戶嘗試基于自有數據對開源模型進行定制。但模型定制本身也面臨諸多挑戰——需要專業技能,需要高質量數據,才能獲得理想效果。
在這方面,我們的Amazon SageMaker AI產品提供了豐富的模型定制支持。在本次re:Invent大會上,我們發布了四種不同的模型定制能力,包括強化微調、模型定制化訓練、無檢查點訓練,以及Amazon Nova Forge
這里特別想介紹Nova Forge。Nova Forge允許用戶在基礎模型訓練階段就注入自己的數據。
打個比方:一個人學習語言,什么時候效果最好?在年幼時期,大腦還在發育階段,學習能力最強,幾乎不知不覺就能掌握一門語言。但如果到了大學階段再去學一門新語言,可能需要付出極大努力,效果卻不如幼年時期。
大語言模型的定制邏輯與此類似。如果能在模型開發階段就進行定制,效果遠優于模型完成后再做調整
劃定邊界:讓Agent既自主又可控
當我們把Agent交付給用戶使用時,如果缺乏適當的約束,可能會產生意想不到的后果。這是我們必須規避的風險。
目前業界常見兩種極端做法:一種是對Agent嚴防死守,另一種是過度依賴人工干預。顯然,這兩種方式都不是理想選擇。
針對這一問題,我們在本次re:Invent大會上為AgentCore發布了一項新特性——Policy(策略)。
通過Policy,可以為Agent定義一個行為框架。在這個框架內,Agent可以自主完成任務;但Policy能夠明確界定Agent不可逾越的邊界。比如,合規性限制、安全紅線等都可以通過Policy來配置。我們已經有客戶在實際使用這一工具,通過Policy實現安全可靠的Agent運行。
再談談自動化。
過去,人類實現工作流自動化主要依賴RPA(機器人流程自動化,Robotic Process Automation)技術。但大模型的出現帶來了新的可能性:大模型能夠處理更復雜、更靈活的任務,但如何讓它與現有工作流深度結合?
為此,我們開發了Amazon Nova Act
Nova Act深度集成了大模型能力與AgentCore的工程化能力,打造了全新的工作流自動化方案。與傳統RPA工具不同,Nova Act因為融合了大模型的智能,整體成功率可以達到80%以上。通過Nova Act,大模型可以直接與執行器、瀏覽器進行交互,實現端到端的工作流自動化。
最后介紹兩個案例。
Blue Origin(藍色起源)是美國一家商業航天公司,專注于火箭與太空探索。他們已經通過Bedrock和Strands Agents等服務構建了超過2700個內部Agent,實現了75%的交付效率提升,設計質量相比原始方案提高了40%。
Sony(索尼)是全球領先的電子與娛樂公司。Sony通過構建Agent能力打造了內部的“Data Ocean”數據平臺。他們基于Bedrock構建企業級大模型,每天服務超過57000名內部用戶,處理多達15萬次推理請求。同時,Sony還使用微調能力對Amazon Nova 2.0 Lite進行了定制,將合規審核效率提升了整整100倍。
re:Invent 2025發布了大量新產品,由于時間有限,今天只能介紹其中一部分。通過這些產品,我們希望能夠幫助更多企業獲得更強的工程化能力,在Agent應用中取得更高的效率。
也希望大家在構建和應用Agent時,可以嘗試今天提到的這些能力。
讓我們一起構建未來。





京公網安備 11011402013531號