揭秘Agent落地困局！93%企業項目卡在POC到生產最后一公里

IP屬地中國·北京 量子位 時間：2025-12-25 18:16:35

編輯部整理自凹非寺量子位 | 公眾號 QbitAI
Agent的真正價值不在于演示效果多驚艷，而在于能否真正跑在生產環境里。數據顯示，超過93%的企業Agent項目卡在了從POC（概念驗證）到生產的最后一公里。
在量子位MEET2026智能未來大會上，亞馬遜云科技大中華區產品部總經理陳曉建系統闡述了企業級Agent從開發到生產的完整路徑。
這個數字背后，是無數企業在Agent落地過程中踩過的坑：開發門檻高、工程化能力缺失、模型定制困難、安全邊界模糊。

在剛剛結束的AWS re:Invent 2025大會上，亞馬遜云科技將聚光燈對準了Agent。不是因為其他技術不重要，而是整個行業都意識到：Agent正在成為AI生產力釋放的關鍵樞紐。
陳曉建的分享，正是圍繞“如何讓Agent真正跑起來”這一核心命題展開。
MEET2026智能未來大會是由量子位主辦的行業峰會，近30位產業代表與會討論。線下參會觀眾近1500人，線上直播觀眾350萬+，獲得了主流媒體的廣泛關注與報道。
核心觀點梳理
一個成功的Agent需要三個模塊：模型（大腦）、代碼（邏輯）、工具（連接物理世界的手腳）。三者的有效連接是最大的工程挑戰。十幾行代碼實現過去數千行才能完成的功能，這就是模型驅動開發帶來的效率躍遷。93%的Agent項目卡在POC到生產的跨越上，核心原因是數據質量落差和工程化能力缺失。模型定制的最佳時機是在基礎模型訓練階段，就像人類學習語言，年幼時效果遠好于成年后。對Agent既不能嚴防死守，也不能過度放任，正確做法是通過策略框架劃定行為邊界。
以下為陳曉建演講全文：
Agent成功的三要素：模型、代碼與工具
Agent正在從各個維度釋放AI的生產力潛能，它可以替代許多人類以往的工作，甚至能夠完成人類此前無法企及的任務。然而從創意到落地，中間需要跨越的鴻溝遠比想象中更寬。
我們認為，一個成功的Agent需要三個至關重要的模塊。
第一是底層模型。
模型是Agent的大腦，負責產生智慧、提供決策，承擔推理、規劃與執行的核心職能。
第二是代碼。
任何Agent都需要服務于特定場景，提供該場景所需的功能邏輯。這些邏輯需要像構建傳統軟件一樣，通過代碼來實現。這一點與大多數已有軟件并無本質區別。
第三是工具。
如果把模型比作大腦，那么工具就是連接大腦與物理世界的手和腳。在整個架構中，工具層包括連接不同信息源的各類協議，以及執行各種行為的代碼——比如知識庫、數據庫、代碼庫，或者瀏覽器等外部能力。
當然，我們看到很多客戶在嘗試用自己的方式構建Agent。但如何有效連接這三個模塊，帶來了巨大的復雜性與挑戰。如何高效調用模型能力？如何組織代碼邏輯？如何打通與物理世界的連接？不同工具之間的編排，更是給開發者帶來了前所未有的新課題。
十幾行代碼完成過去數千行的工作
基于這些挑戰，我們從2024年開始規劃：如何構建一套工具，降低開發者構建Agent的門檻？如何讓工具編排更加自動化？如何讓大模型調用更加便捷？
今年，我們正式推出了Strands Agents
Strands Agents采用模型驅動的方法論，讓大語言模型能夠自主處理各種場景，從而大幅簡化開發Agent所需的代碼量。我們經常收到客戶反饋：過去需要數千行代碼才能開發的場景，現在只需要短短十幾行就能實現
在推出Strands Agents時，我們就將其定位為一個開源項目。用戶不僅可以直接使用，還可以獲取完整源碼。更重要的是，Strands Agents采用開放架構，不僅適配亞馬遜云科技自身的產品，也兼容業界各種流行的開源或商用框架。
在上周的re:Invent大會上，我們同步發布了兩項重要更新。
一是支持Typescript語言。Typescript是業界廣泛使用的編程語言，通過支持這一語言，可以幫助更多開發者構建更適用的Agent方案。
二是支持邊緣設備部署。邊緣設備正日益成為人類生活與工作不可分割的一部分，Strands Agents可以為汽車、游戲、機器人等各類終端提供Agent能力，讓Agent不僅能在云端運行，也能在前端智能設備上運行。
93%的項目卡在POC到生產的跨越上
除了開發工具，我們還看到大量客戶在Agent的部署與上線階段遭遇困難。
有一組來自第三方調研的數據值得關注：93%的客戶在從POC階段邁向生產階段時遇到了重大障礙。換言之，可能只有不到10%的客戶能夠真正將Agent從POC推進到最終生產環境。
原因是什么？
POC與生產環境之間存在本質差異。在POC階段，我們可能只需要關注代碼效果如何。但到了生產階段，很多客戶發現，原先在POC階段表現優異的效果突然變得不盡如人意。
一個重要原因是數據。在POC階段，數據可以經過精心挑選，保證高質量。但在真實生產環境中，數據是無法被人為篩選和優化的。數據質量的落差，往往是POC與生產效果差異的核心原因。
另一個主要原因是工程化挑戰。一旦業務從POC走向生產，就必須直面一系列生產環境特有的問題：安全、擴容、成本、高可用……這些問題在POC階段完全不需要考慮，但上了生產就必須正視。
正是基于這些考量，我們意識到：不僅要提供降低編程門檻的開發工具，還需要提供工程化能力，幫助客戶跨越從POC到生產的鴻溝。
這就是我們在2025年7月推出Amazon Bedrock AgentCore的原因。
AgentCore是一個完整的工具箱，提供多種能力幫助客戶實現底層基礎架構的編排。當您的Agent部署上云時，無需關心底層的計算資源、網絡資源、安全配置、可觀測性如何實現——AgentCore會幫您完成這些底層資源的動態管理。這將極大地幫助客戶解決從POC到生產過程中遇到的工程化難題。
模型定制：在“年幼時”學習效果最好
當Agent進入生產環境后，還會面臨一系列效率問題：延遲、可擴展性、敏捷性……這些都是實際生產中必須關注的特性。如果延遲從幾百毫秒飆升到秒級以上，用戶體驗會受到極大影響；如果可擴展性不足，業務高峰期同樣會出現瓶頸。
這里要談談模型定制的挑戰。
在很多場景下，通用大模型在標準場合表現出色，但在特定垂直場景中可能無法滿足需求。因此，許多客戶嘗試基于自有數據對開源模型進行定制。但模型定制本身也面臨諸多挑戰——需要專業技能，需要高質量數據，才能獲得理想效果。
在這方面，我們的Amazon SageMaker AI產品提供了豐富的模型定制支持。在本次re:Invent大會上，我們發布了四種不同的模型定制能力，包括強化微調、模型定制化訓練、無檢查點訓練，以及Amazon Nova Forge
這里特別想介紹Nova Forge。Nova Forge允許用戶在基礎模型訓練階段就注入自己的數據。
打個比方：一個人學習語言，什么時候效果最好？在年幼時期，大腦還在發育階段，學習能力最強，幾乎不知不覺就能掌握一門語言。但如果到了大學階段再去學一門新語言，可能需要付出極大努力，效果卻不如幼年時期。
大語言模型的定制邏輯與此類似。如果能在模型開發階段就進行定制，效果遠優于模型完成后再做調整
劃定邊界：讓Agent既自主又可控
當我們把Agent交付給用戶使用時，如果缺乏適當的約束，可能會產生意想不到的后果。這是我們必須規避的風險。
目前業界常見兩種極端做法：一種是對Agent嚴防死守，另一種是過度依賴人工干預。顯然，這兩種方式都不是理想選擇。
針對這一問題，我們在本次re:Invent大會上為AgentCore發布了一項新特性——Policy（策略）。
通過Policy，可以為Agent定義一個行為框架。在這個框架內，Agent可以自主完成任務；但Policy能夠明確界定Agent不可逾越的邊界。比如，合規性限制、安全紅線等都可以通過Policy來配置。我們已經有客戶在實際使用這一工具，通過Policy實現安全可靠的Agent運行。
再談談自動化。
過去，人類實現工作流自動化主要依賴RPA（機器人流程自動化，Robotic Process Automation）技術。但大模型的出現帶來了新的可能性：大模型能夠處理更復雜、更靈活的任務，但如何讓它與現有工作流深度結合？
為此，我們開發了Amazon Nova Act
Nova Act深度集成了大模型能力與AgentCore的工程化能力，打造了全新的工作流自動化方案。與傳統RPA工具不同，Nova Act因為融合了大模型的智能，整體成功率可以達到80%以上。通過Nova Act，大模型可以直接與執行器、瀏覽器進行交互，實現端到端的工作流自動化。
最后介紹兩個案例。
Blue Origin（藍色起源）是美國一家商業航天公司，專注于火箭與太空探索。他們已經通過Bedrock和Strands Agents等服務構建了超過2700個內部Agent，實現了75%的交付效率提升，設計質量相比原始方案提高了40%。
Sony（索尼）是全球領先的電子與娛樂公司。Sony通過構建Agent能力打造了內部的“Data Ocean”數據平臺。他們基于Bedrock構建企業級大模型，每天服務超過57000名內部用戶，處理多達15萬次推理請求。同時，Sony還使用微調能力對Amazon Nova 2.0 Lite進行了定制，將合規審核效率提升了整整100倍。
re:Invent 2025發布了大量新產品，由于時間有限，今天只能介紹其中一部分。通過這些產品，我們希望能夠幫助更多企業獲得更強的工程化能力，在Agent應用中取得更高的效率。
也希望大家在構建和應用Agent時，可以嘗試今天提到的這些能力。
讓我們一起構建未來。

免責聲明：本網信息來自于互聯網，目的在于傳遞更多信息，并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益，請及時聯系我們，本站將會在24小時內處理完畢。

同類資訊

鏖戰2025年，大模型圍著開源轉

“十四五”期間，我國5G用戶普及率從15%增至83.9%

舊金山一場停電，為什么馬斯克會“幸災樂禍”？

魯豫對話鴻蒙開發者：把興趣寫進系統里的年輕人

華碩終于發布RTX 5090D v2顯卡！OC版已正式上架：19999元

張一鳴押注、豆包加持！字節AR眼鏡外觀圖曝光

全站最新

鏖戰2025年，大模型圍著開源轉

“十四五”期間，我國5G用戶普及率從15%增至83.9%

舊金山一場停電，為什么馬斯克會“幸災樂禍”？

魯豫對話鴻蒙開發者：把興趣寫進系統里的年輕人

熱門推薦

OPPO Pad Air5上架開啟預售：售價1899元起

鏖戰2025年，大模型圍著開源轉

V觀財報｜通光線纜：未與SpaceX開展合作

“十四五”期間，我國5G用戶普及率從15%增至83.9%

舊金山一場停電，為什么馬斯克會“幸災樂禍”？

魯豫對話鴻蒙開發者：把興趣寫進系統里的年輕人

華碩終于發布RTX 5090D v2顯卡！OC版已正式上架：19999元

張一鳴押注、豆包加持！字節AR眼鏡外觀圖曝光

四大重磅舉措落地！徐匯AI+區塊鏈融合創新閃耀CCF中國區塊鏈技術大會

舊金山一場停電，為什么馬斯克會“幸災樂禍”？ | 電廠

在AI面前，人類終于不說謊了

iPhone Fold依舊有折痕：蘋果沒有攻克這一行業難題

李想“揮淚”送張驍，新L7 L8明年要打硬仗

九識聯手菜鳥對戰新石器？無人配送再生變

昇思MindSpore引領AI框架邁入“超節點時代”

首頁

資訊

財經號

智能車

專題

電商資訊

人物資訊

滾動資訊

首頁

新科技

新金融

新零售

智能車

房地產

科技探索

人物資訊

網絡游戲

人工智能

揭秘Agent落地困局！93%企業項目卡在POC到生產最后一公里

編輯部整理自凹非寺量子位 | 公眾號 QbitAI

首頁

資訊

財經號

智能車

專題

電商資訊

人物資訊

滾動資訊

揭秘Agent落地困局！93%企業項目卡在POC到生產最后一公里

編輯部 整理自 凹非寺量子位 | 公眾號 QbitAI

同類資訊

編輯部整理自凹非寺量子位 | 公眾號 QbitAI