12月23日,百度AI發文稱,文心新模型 ERNIE-5.0-Preview-1203 以 1451 分登上 LMArena 文本榜,排名中國第一。在創意寫作、高難度指令等方面表現突出,超過Claude-Opus-4-1、GPT-5.2、GPT-5.1和Qwen3-Max-Preview等多款國內外主流模型。
據了解,LMArena文本榜是一個評估大型語言模型核心能力的平臺。它通過一套標準化的測試,對全球主流模型在文本理解、邏輯推理、知識問答、代碼生成和創意寫作等方面的能力進行量化評分和排名。
12月23日,百度AI發文稱,文心新模型 ERNIE-5.0-Preview-1203 以 1451 分登上 LMArena 文本榜,排名中國第一。在創意寫作、高難度指令等方面表現突出,超過Claude-Opus-4-1、GPT-5.2、GPT-5.1和Qwen3-Max-Preview等多款國內外主流模型。
據了解,LMArena文本榜是一個評估大型語言模型核心能力的平臺。它通過一套標準化的測試,對全球主流模型在文本理解、邏輯推理、知識問答、代碼生成和創意寫作等方面的能力進行量化評分和排名。
免責聲明:本網信息來自于互聯網,目的在于傳遞更多信息,并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益,請及時聯系我們,本站將會在24小時內處理完畢。
熱門推薦