大模型發(fā)布頻繁,Claude Opus 4.5 強(qiáng)勢登場。Anthropic 宣稱 Opus 4.5 更聰明省心,在編程、搭 agents、操控電腦等系統(tǒng)級任務(wù)中表現(xiàn)卓越,日常案頭工作也明顯增強(qiáng)。Opus 4.5 已全面開放,可通過應(yīng)用、API 和三大云平臺使用,開發(fā)者可通過 Claude API 調(diào)用。
Opus 4.5 的工具鏈全面升級,包括開發(fā)者平臺、Claude Code、Chrome 插件、Excel 和桌面端改造。其對模糊需求理解力提升,能自行定位復(fù)雜 bug,在軟件工程測試 SWE-Bench Verified 中得分超 80%,在多種編程語言中表現(xiàn)突出。在 Anthropic 招聘測試中,Opus 4.5 的得分超過所有人類候選人。
Opus 4.5 的能力超越部分評測標(biāo)準(zhǔn),在智能體能力測試中展現(xiàn)出創(chuàng)造性解決問題的能力。Claude Code 進(jìn)行了重大更新,計(jì)劃模式可生成更精確的執(zhí)行計(jì)劃,并已登陸桌面應(yīng)用。Claude 應(yīng)用的長對話功能得到改進(jìn),實(shí)現(xiàn)了用戶呼吁的“無盡對話”。
Claude for Chrome 向 Max 用戶開放,Claude for Excel 的 Beta 測試范圍擴(kuò)大。Opus 4.5 的底層升級使其在解決問題時(shí)更高效,API 新增 effort 參數(shù),可根據(jù)需求平衡時(shí)間和成本與模型能力。Opus 4.5 還提升了工具使用效率,通過新功能減少 token 使用量,提升準(zhǔn)確度。
開發(fā)者平臺更具可組合性,提供模塊化構(gòu)建能力。Opus 4.5 與前代模型相比,擅長編程和系統(tǒng)級操作,未來選擇模型需綜合考慮其“性格”與需求匹配度。





京公網(wǎng)安備 11011402013531號