欧美午夜性色大片在线观看_国产成人午夜电影网_91精品国产综合久久精品_污污片在线免费视频_日日干夜夜操s8_国产精品亚洲片在线播放_久久久久亚洲av无码专区_性欧美大战久久久久久久久_国产欧美在线观看视频_日韩国产中文字幕

當前位置: 首頁 ? 資訊 ? 新科技 ? 正文

編程測試碾壓人類!Claude Opus 4.5 深夜突襲,AI 編程進入「超人時代」

IP屬地 中國·北京 愛范兒 時間:2025-11-25 08:13:59

最近這段時間,大模型發布就跟下餃子似的,一個接一個往外冒。

前腳 Gemini 3 Pro 剛搶了兩周風頭,后腳 Claude Opus 4.5 剛剛就正式發布,還是主打編程,還是那個熟悉的味道。

Anthropic 官方宣稱 Opus 4.5 整體更聰明、更省心。遇到編程、搭 agents、操控電腦這些「系統級任務」依然是全球數一數二的水平。日常的研究、做 PPT、處理表格這些案頭活,也都明顯變強了。

今天起,Opus 4.5 已經全面開放,可以通過應用、API,還有三大主流云平臺用起來。開發者只要在 Claude API 里調用 claude-opus-4-5-20251101 就行。

隨發布而來的,是一整個工具鏈升級。開發者平臺、Claude Code、Chrome 插件、Excel、桌面端改造,還有「長對話不卡頓」。從應用到 API,再到云平臺,這次是真的全線鋪開。

Anthropic’s New Claude Opus 4.5 Reclaims the Coding Crown – The New Stack

大模型集體「上新季」,Opus 4.5 強勢壓軸

從官方和測試者的反饋看,Claude Opus 4.5 對「模糊需求」的理解力得到了明顯提升,復雜 bug 自行定位也更穩,不少提前試用的客戶覺得 Opus 4.5 是真的能「理解」他們想要啥。


在真實場景的軟件工程測試 SWE-Bench Verified 里,它是頭一個拿到 80% 以上分數的模型。


Opus 4.5 的代碼質量全面升級,在 SWE-bench Multilingual 涵蓋的八種編程語言里,它在其中七種都拔得頭籌,表現相當亮眼。


而舉例而言,Anthropic 團隊把 Opus 4.5 扔進了公司招性能工程師時用的高難度測試題里,結果在規定的兩小時內,Claude Opus 4.5 的得分超過了所有人類候選人。

雖然編程測試只能衡量技術能力和時間壓力下的判斷力,那些多年經驗積累出來的直覺、溝通協作能力,這些同樣重要的素質并不在考察范圍內。

除卻軟件工程,Claude Opus 4.5 的整體能力也迎來了全面開花,在視覺、推理和數學方面都比前代模型強,并且在多個重要領域都達到了業界領先水平:


更關鍵的是,模型的能力甚至開始超越現有的一些評測標準了。

在智能體能力測試 τ2-bench 里就出現了這么個場景:測試設定模型扮演航空公司客服,幫一位焦慮的乘客。

按照規則,基礎經濟艙機票是不能改的,所以測試預期模型會拒絕乘客的請求。結果 Opus 4.5 想出了一個巧妙方案:先把艙位從基礎經濟艙升級到普通經濟艙,然后再改航班。

這辦法完全符合航空公司政策,卻不在測試的預期答案范圍內。從技術角度說,這算是測試失敗了,但這種創造性解決問題的方式,恰恰展現了 Opus 4.5 的獨特之處。


當然了,在另一些場景下,這種「鉆規則空子」的行為可能就不那么受歡迎了。如何防止模型以非預期方式偏離目標,這是 Anthropic 安全測試重點關注的方向。

Claude 無處不在,桌面、瀏覽器、Excel 全接入

隨著 Opus 4.5 的推出,Claude Code 獲得了兩項重大更新。

計劃模式(Plan Mode)現在能生成更精確的執行計劃了,Claude 會在操作前主動提澄清性問題,然后生成一個用戶可編輯的 plan.md 文件,再根據這計劃執行任務。

此外,Claude Code 現在已經登陸桌面應用了。你可以同時跑多個本地或遠程會話,比如一個智能體負責修代碼錯誤,另一個負責在 GitHub 上檢索資料,第三個就更新項目文檔。


對于 Claude 應用用戶來說,長對話不會再被打斷了。Claude 會在需要的時候自動總結早期上下文,讓對話持續下去。

Anthropic 研究產品管理負責人 Dianne Na Penn 在接受采訪時表示:

「我們在 Opus 4.5 的訓練過程中提升了對長上下文的整體處理能力,但光有更長的上下文窗口是不夠的。知道哪些信息值得記住,同樣非常關鍵。」

這些改進也實現了 Claude 用戶長期呼吁的一項功能:「無盡對話」。這功能能夠讓付費用戶在對話超過上下文窗口限制時也不會中斷,模型會自動壓縮上下文記憶,而不用提醒用戶。

Claude for Chrome 也已經向所有 Max 用戶開放了,可以讓 Claude 直接在瀏覽器多個標簽頁之間執行任務。


Claude for Excel 的 Beta 測試范圍已經擴展到 Max、Team 和 Enterprise 用戶了。

對于能使用 Opus 4.5 的 Claude 和 Claude Code 用戶,Anthropic 已經取消了和 Opus 相關的使用上限。
對于 Max 用戶和 Team Premium 用戶,Anthropic 也提高了整體使用限額,用戶可使用的 Opus token 數量與之前使用 Sonnet 時大致相同。隨著未來更強模型的出現,配額也會根據情況相應更新。

讓模型「更聰明也更省」,Opus 4.5 迎來底層大升級

隨著模型變得更聰明,它們能用更少的步驟解決問題:減少反復試錯、降低冗余推理、縮短思考過程。

Claude Opus 4.5 和前代模型比,在實現相同甚至更優結果的情況下,用的 tokens 數量明顯少了。

當然了,不同任務需要不同的平衡。

有時開發者希望模型能持續深入思考,有時又需要更快速靈活的響應。

所以,API 里新加了一個叫 effort 的參數,讓你可以根據需求選:要么優先省時間和成本,要么最大化模型能力。任君選擇。
當設置為中等 effort 等級時,Opus 4.5 在 SWE-bench Verified 測試中和 Sonnet 4.5 的最佳成績持平,但輸出 tokens 數減少了 76%。

而在最高 effort 等級下,Opus 4.5 的表現比 Sonnet 4.5 高出 4.3 個百分點,同時還減少了 48% 的輸出量。

憑借 effort 控制、上下文壓縮(context compaction)和高級工具調用能力,Claude Opus 4.5 能跑更久、完成更多任務,而且需要的人工干預更少了。


此外,真正的 AI 智能體需要在成百上千種工具之間無縫協作。

想象一個 IDE 助手集成了 Git、文件管理、測試框架和部署流程,或者一個運營智能體同時連著 Slack、GitHub、Google Drive、Jira 和幾十個 MCP 服務器。

問題在于,傳統方式會把所有工具定義一次性塞進上下文。拿連接五個服務器的系統來說,GitHub 需要 26K tokens,Slack 需要 21K tokens,Sentry、Grafana、Splunk 加起來又是 8K tokens。

對話還沒開始呢,就已經占了 55K tokens 了。要是再加上 Jira,輕松突破 100K tokens。更麻煩的是,當工具名字相似時,模型容易選錯工具或者傳錯參數。


Anthropic 推出了三項新功能來解決這些問題。

Tool Search Tool 讓 Claude 按需動態發現工具,只加載當前任務需要的部分,token 使用量能減少約 85%。

Programmatic Tool Calling 讓 Claude 在代碼里直接調用工具,避免每次調用都要完整推理一遍。

Tool Use Examples 則提供統一標準,通過示例而不是 JSON schemas 來展示工具的正確用法。

內部測試顯示,啟用 Tool Search Tool 后,Opus 4 在 MCP 測試中的準確度從 49% 提升到 74%,Opus 4.5 從 79.5% 提升到 88.1%。
Claude for Excel 就是利用 Programmatic Tool Calling 來處理幾千行數據,而不會讓上下文窗口過載。

Anthropic 的上下文管理和記憶能力明顯提升了模型在智能體(agent)任務中的表現。

Opus 4.5 還能高效管理多個子智能體(subagents),從而搭建復雜且協調良好的多智能體系統。在測試中,結合這些技術后,Opus 4.5 在深度研究類評估中的表現提升了將近 15 個百分點。

開發者平臺(Developer Platform)也在持續變得更具可組合性,希望提供靈活的「模塊化構建」能力,讓你能根據具體需求自由控制模型的效率、工具使用和上下文管理,搭建出理想的智能系統。


雖然這次 Opus 4.5 的升級足夠亮眼,但一個越來越清晰的趨勢是:不同模型的「性格」差異正在被放大。

從 Claude 過往的產品線來看,Opus 這類「超大杯」依舊最擅長編程、系統級操作、結構化推理;但如果是文案工作,Sonnet 的表現和性價比往往更對路。

這次發布,也再次印證了這一點。

未來選模型,不光要看跑分榜,還得看它的「做事」方式是不是跟你合拍。換句話說,選擇模型,倒是越來越像挑同事了。

附上官方博客地址:
https://www.anthropic.com/news/claude-opus-4-5

免責聲明:本網信息來自于互聯網,目的在于傳遞更多信息,并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益,請及時聯系我們,本站將會在24小時內處理完畢。

丰满亚洲少妇av| 久久免费国产精品| 欧美xo影院| 老司机在线免费视频| 亚洲国产无线乱码在线观看| 天天影视色综合| 美女亚洲精品| 欧美美女18p| 毛片网站免费| 永久av免费网站| 男女av免费观看| 91丨九色丨国产| www.国产一区| 久久精品av| 一本到av在线| 国产精品一区二三区| 中文字幕av免费观看| 久久中文字幕精品| 亚洲va在线va天堂va偷拍| 色一情一乱一伦一区二区三区丨| 日韩美女视频免费在线观看| 亚洲男人天堂2019| 91豆麻精品91久久久久久| 久久理论电影网| 国产调教在线| 蝌蚪91视频| 深爱激情五月婷婷| 国产精品久久久久久人| 免费黄色片网站| 国产又粗又长又爽又黄的视频| 国产成年人在线观看| 国产亚洲福利社区| 国产精品入口日韩视频大尺度 | 日韩欧美一级在线| 亚洲一区中文字幕| 成人免费小视频| 亚洲激情一区二区| 一本久久a久久精品亚洲| 91丝袜呻吟高潮美腿白嫩在线观看| 一本综合久久| 久久美女精品| 欧美色图五月天| 久久天堂影院| 亚洲欧美小说色综合小说一区| av大全在线免费看| 在线影院福利| www.国产精| www.青青草.com| 国产精品爱久久久久久久小说| 色综合免费视频| 国产伦精品一区二区三区视频痴汉| 日韩熟女精品一区二区三区| 日韩精品一区二区亚洲av性色| 最新版天堂资源在线| 男女曰b免费视频| 91国在线高清视频| 一区二区三区|亚洲午夜| 久久99精品久久久久久青青日本 | 国产h视频在线观看| 在线观看麻豆视频| 97影院手机在线观看| 另类图片亚洲色图| 天天操天天怕| 爆操妹子视频在线观看| 黄页网站在线免费观看| 天堂网在线.www天堂在线视频| 欧美成人禁片在线观看网址| 亚洲精品在线视频免费| 色妇色综合久久夜夜| 黄网站在线观看永久免费| 中文字幕第一页在线| 男女作爱免费网站| 欧美午夜性囗交xxxx| 国产午夜三区视频在线| 91香蕉在线| 先锋音影av资源中文网| 精品国产一区二区三区久久久狼牙| 九九热精品在线视频| 国产精彩自拍| 成年网站在线看| 黄色成人免费观看| 偷偷要 色偷偷| 性色视频在线观看| 国产小视频福利在线| a√在线中文网新版址在线| 亚洲图片88| 金瓶狂野欧美性猛交xxxx| yellow在线观看网址| 欧美色网一区| 欧美精品影院| 综合色就爱涩涩涩综合婷婷| 亚洲精品国产首次亮相| 99这里有精品| 日韩精品乱码免费| 成人免费视频免费观看| 久久久久久久久久久久久女国产乱| 国产精品美女久久久久高潮| 亚洲午夜久久久久久久久久久| 日韩欧中文字幕| 日韩欧美电影一区| 一本一道久久a久久精品逆3p | 国内精品久久久久国产| 亚洲精品天堂| jizz欧美| 精品一区亚洲| 国内久久精品| 亚洲色图偷拍自拍| 久久久国产成人| 国产午夜视频在线播放| 91好色先生tv| 亚洲欧美另类色图| 天天操夜夜摸| 中国日本在线视频中文字幕| 国产直播在线| 无码小电影在线观看网站免费| 国产色99精品9i| 成人短片线上看| 久久综合九色| 久久久久久亚洲综合影院红桃 | www中文字幕| 美女不穿衣服的网站| 中文字字幕在线中文乱码电影| а√天堂8资源在线官网| 成人黄色视屏网站| 成人vr资源| 精品一区二区在线免费观看| 国产精品久99| 日韩一区二区视频| 欧美大尺度激情区在线播放 | 成年人av电影| 亚洲一区二区视频在线播放| 欧美人与动性xxxxbbbb| 免费免费啪视频在线观看| h片在线免费| 精品欠久久久中文字幕加勒比| 国自产拍偷拍福利精品免费一| 国产精品一区二区视频| 亚洲国产精品天堂| 亚洲色图校园春色| 91久久精品日日躁夜夜躁国产| 欧美xxxx吸乳| 日韩黄色一区二区| 日本特级黄色片| 国产一卡2卡3卡四卡网站| 小草av在线播放| 天堂久久一区| 亚洲久久一区二区| 中文字幕中文字幕在线一区 | 草草草视频在线观看| 中文字幕永久免费| 亚洲精品毛片一区二区三区| 在线观看免费电影| 麻豆视频在线观看免费| 开心激情综合| 岛国片免费观看| 青檬在线电视剧在线观看| 日韩国产网站| 性色一区二区| 日本免费专区| 在线观看免费观看在线91| 日本美女一区| 亚洲一区二区免费看| 亚洲人成小说网站色在线| 亚洲精品在线视频| 国产精品久久久久久久久久直播| 99免费视频观看| 日韩黄色a级片| 在线观看的黄色网址| 国产福利在线免费观看| 亚洲精品中文字幕乱码| 中文字幕精品三区| 亚洲午夜精品视频| 日韩精品一区二区三区色偷偷| 国产伦精品一区三区精东| 亚洲精品国产av| 日韩精品视频在线观看一区二区三区| 中文字幕一区二区三区四区久久| 激情深爱一区二区| 欧美一级在线免费| 不卡视频一区二区| 中文视频在线观看| 影音先锋男人资源站在线观看| av影片在线看| 亚洲九九视频| 亚洲午夜一二三区视频| 欧美亚洲一区在线| 99视频精品免费| 在线免费观看日韩视频| 原千岁中文字幕| 日本在线中文字幕一区| 久久蜜桃av一区精品变态类天堂| 亚洲丝袜av一区| 亚洲欧洲精品在线| 青青草手机在线观看| 夜色资源网av在先锋网站观看| 色综合久久久| 成人福利视频在线看| 亚洲人成网站在线播| 美国av在线播放| 成年人午夜视频| 簧片在线观看| 99久久久久国产精品| 亚洲欧美日本韩国| 中国女人久久久| 欧美日韩在线亚洲一区蜜芽| 91久久国产综合久久91精品网站 | 国产精品jizz视频| 蜜臀av粉嫩av懂色av| 77777_亚洲午夜久久多人| 伊人春色在线观看| 久久精品亚洲| 精品久久久久久久一区二区蜜臀| 欧美一级二级三级九九九| 九九热最新地址| 87福利电影网| 麻豆一区二区| 亚洲一线二线三线视频| 国产精品视频免费观看www| 久久精品无码专区| 国产精品乱码一区二区三区视频 | 青青草国产精品视频| 337p粉嫩色噜噜噜大肥臀| 天堂在线中文资源| 欧美国产三区| 欧美日韩国产影片| 蜜桃导航-精品导航| 一区二区在线观看免费视频| 国模大尺度私拍在线视频| 成人在线视频免费观看| 91成人看片片| 久久久水蜜桃| av黄色在线播放| 国产视频精品久久| 久久久久.com| 影音先锋日韩有码| 韩国视频一区二区三区| 欧美日韩亚洲第一页| 玖玖玖电影综合影院| 综合激情成人伊人| 91麻豆桃色免费看| 欧美精品成人久久| 免费在线国产| 在线看的网站你懂| 性欧美暴力猛交另类hd| 亚洲社区在线观看| 亚洲国产精品av| 精品自拍视频| 日日嗨av一区二区三区四区| 亚洲免费视频网站| 99久久激情视频| 中文字幕乱码一区| 日日摸日日添日日躁av| 欧美国产一级| 欧美一区二区三区影视| 免费在线黄网站| 男女啪啪a级毛片| 嗯用力啊快一点好舒服小柔久久| 黄色一区二区三区| 日本高清不卡三区| 偷拍夫妻性生活| 亚洲第一成年网| 欧洲一区二区在线观看| 日韩av黄色网址| 久青草免费视频| 黄网页免费在线观看| 99久久精品国产毛片| 国产精品视频yy9099| 麻豆国产尤物av尤物在线观看| av小片在线| 白白色亚洲国产精品| 国产精品香蕉国产| 国产精品500部| 2019中文字幕在线电影免费| 伊人久久久大香线蕉综合直播 | 日产精品久久久一区二区| 中国女人真人一级毛片| 国产 福利 在线| 久久久久99精品| 精灵使的剑舞无删减版在线观看| 91欧美一区二区| 国产精品主播视频| 亚洲欧美日韩激情| 成人香蕉视频| 精品久久久久久亚洲精品| 中文字幕一区二区三区四区五区六区| 丰满熟女一区二区三区| 免费日韩一区二区三区| 日韩久久精品一区| 国产精品嫩草影视| 在线午夜视频| 91网站最新网址| 国产一区二区黄色| 欧美熟妇乱码在线一区| 偷拍一区二区| 日韩不卡在线观看| japanese在线观看| 黄色大片在线看| 欧美国产成人在线| 亚洲精品视频一二三| 性欧美videos精品| 久久精品国产大片免费观看| 亚洲最大中文字幕| 国产精品麻豆免费版现看视频| av黄在线观看| 久久精品国产免费看久久精品| 国产乱肥老妇国产一区二| 亚洲一区精品在线观看| 国产精品毛片视频| 亚洲精品动漫久久久久| 成年人免费观看视频网站| 黄av在线播放| 精品人伦一区二区三区蜜桃网站| 国产av天堂无码一区二区三区| sese视频| 福利一区福利二区| 免费亚洲一区二区| 国产精品免费视频一区一| 久久综合导航| 91在线高清免费观看| 亚洲国产精品18久久久久久| 欧洲福利电影| 欧美激情videos| 日本少妇全体裸体洗澡| 国产一区二区三区四区五区3d| 日韩欧美久久一区| 精品人伦一区二区| 成人在线黄色电影| 欧美午夜精品免费| 国产人妖在线观看| 动漫一区在线| 精品久久久久久久中文字幕 | 国模吧视频一区| 国产脚交av在线一区二区| www久久久久久| 五月精品视频| 国产精品第三页| 国产成人高潮免费观看精品| www.com亚洲| 亚洲激情77| 国内精品视频一区| 99久久精品无免国产免费| 天天影视综合| 国产精品久久久久久久久影视| 天天色天天操天天射| 亚洲永久视频| 成人免费视频网站| 再深点灬舒服灬太大了少妇| 国产福利精品导航| 日韩video| 中文字幕在线影院| 亚洲一区二区三区视频在线 | 国产精品视频福利| 国产精品区一区二| 成人免费视频免费观看| 久久久久99精品成人片| 尤物视频网站在线观看| 亚洲成av人片| 久久人人爽人人爽人人片| 美女网站视频一区| 影音先锋欧美精品| 国产又大又黄的视频| 一区二区三区四区五区精品视频 | 成人v精品蜜桃久久一区| 天天操天天综合网| 日本一区二区黄色| 97在线观看免费观看高清| 欧美网站大全在线观看| 性猛交ⅹxxx富婆video| 国产亚洲字幕| 欧美成人精品在线视频| 亚洲国产欧美另类| 久久久777| 免费看污污视频| 久草在线网址| 日韩一区二区在线观看视频播放| 久久久精品视频免费| 国产成人av| 国产欧美久久一区二区| 国产麻豆免费| 国产日产欧美一区二区三区 | 日韩电影在线观看网站| 中国人体摄影一区二区三区| 一级片在线观看| 欧美午夜精品一区| 国产在线拍揄自揄拍无码视频| 日韩欧美视频专区| 国产精品免费区二区三区观看| 三级短视频在线| 精品国产福利视频| www.99re6| 欧美丝袜丝交足nylons172| 51国偷自产一区二区三区| 麻豆入口视频在线观看| 亚洲h动漫在线| 在线视频这里只有精品| 91欧美在线| 日本a级片久久久| 国产在线视频网址| 亚洲第一av在线| 高潮毛片7777777毛片|