今年論壇,智源大會(huì)將圍繞人工智能基礎(chǔ)理論、應(yīng)用探索、產(chǎn)業(yè)創(chuàng)新、可持續(xù)發(fā)展四大主題,設(shè)立近20場專題論壇,涵蓋深度推理模型、多模態(tài)模型、具身智能與人形機(jī)器人、自主智能體、下一代AI路徑探索、腦啟發(fā)、AI fo…
從基礎(chǔ)設(shè)施到產(chǎn)品應(yīng)用,智源對Scaling Law、基礎(chǔ)模型、具身智能、超級(jí)應(yīng)用、AI安全等關(guān)鍵方向作出預(yù)測。 智源研究院院長王仲遠(yuǎn)表示,當(dāng)前,我們處在人工智能發(fā)展的新拐點(diǎn),大模型的能力涌現(xiàn)加速通用人工智能時(shí)…
多項(xiàng)評(píng)測結(jié)果中,字節(jié)跳動(dòng)多項(xiàng)AI能力領(lǐng)先,阿里巴巴、百度等大廠派AI均取得優(yōu)異表現(xiàn)。 在視覺語言多模態(tài)模型能力評(píng)測結(jié)果中,一些較好的開源模型在圖文理解任務(wù)上正在縮小與頭部閉源模型的能力差距,而長尾視覺知識(shí)與文…
在“多模態(tài)模型評(píng)測榜單”的視覺語言模型中,得分國內(nèi)最高的豆包·視覺理解模型也在FORCE原動(dòng)力大會(huì)上正式對外發(fā)布。通過更強(qiáng)的內(nèi)容識(shí)別能力、更強(qiáng)的理解和推理能力、更細(xì)膩的視覺描述能力,豆包·視覺理解模型極大地…
媒體:從發(fā)布的評(píng)測結(jié)果來看,豆包模型在幾個(gè)榜單中的排名都比較靠前,是互聯(lián)網(wǎng)大廠的模型研發(fā)能力在大幅提升嗎?2025年,基于語言模型肯定會(huì)有更多AI Agent(智能體),能完成更復(fù)雜的任務(wù),這是明年的熱點(diǎn)…
在評(píng)測方法與工具上,智源研究院聯(lián)合全國10余家高校和機(jī)構(gòu)合作共建,探索基于AI的輔助評(píng)測模型FlagJudge和靈活全面的多模態(tài)評(píng)測框架FlagEvalMM,并構(gòu)建面向大模型新能力的有挑戰(zhàn)的評(píng)測集,包括與北…
2024年12月19日,智源研究院發(fā)布并解讀國內(nèi)外100余個(gè)開源和商業(yè)閉源的語言、視覺語言、文生圖、文生視頻、語音語言大模型綜合及專項(xiàng)評(píng)測結(jié)果。 智源評(píng)測發(fā)現(xiàn),2024年下半年大模型發(fā)展更聚焦綜合能力提升與實(shí)…
水木清華校友種子基金管理合伙人王學(xué)輝表示:“智源深瀾的團(tuán)隊(duì)在大分子進(jìn)化和設(shè)計(jì)領(lǐng)域選擇了以功能為主要對象而非基于蛋白結(jié)構(gòu)的技術(shù)路線,體現(xiàn)了團(tuán)隊(duì)對AI賦能大分子設(shè)計(jì)的獨(dú)特理解,團(tuán)隊(duì)已在多個(gè)項(xiàng)目中展現(xiàn)了AI在蛋白…
10 月 29 日消息,北京智源人工智能研究院(BAAI)推出了新的擴(kuò)散模型架構(gòu)OmniGen,這是一種用于統(tǒng)一圖像生成的多模態(tài)模型。 ▲ 文本生成圖像,編輯生成圖像的部分元素,根據(jù)生成圖像的人體…
智源研究院院長王仲遠(yuǎn)向鈦媒體App等表示,Emu3證明了下一個(gè)token預(yù)測能在多模態(tài)任務(wù)中有高性能的表現(xiàn),這為構(gòu)建多模態(tài)AGI提供了廣闊的技術(shù)前景。智源探索出了Emu3這樣一條技術(shù)路線,那么接下來需要展示…
智源研究院最新發(fā)布原生多模態(tài)世界模型 Emu3,該模型在文本、圖像、視頻理解與生成方面取得了突破性進(jìn)展。此外,Emu3還提供了強(qiáng)大的視覺tokenizer功能,能夠?qū)⒁曨l和圖像轉(zhuǎn)換為離散token,并且這些…
據(jù)介紹,Emu3 提供了一個(gè)強(qiáng)大的視覺 tokenizer,能夠?qū)⒁曨l和圖像轉(zhuǎn)換為離散 token。 Emu3 研究結(jié)果證明,下一個(gè)token 預(yù)測可以作為多模態(tài)模型的一個(gè)強(qiáng)大范式,實(shí)現(xiàn)超越語言本身的大規(guī)…
作為領(lǐng)先頭部AI公司,百度自2010年起開始全面布局人工智能,是全球?yàn)閿?shù)不多、進(jìn)行全棧布局的人工智能公司,從昆侖芯、飛槳深度學(xué)習(xí)平臺(tái)、文心大模型到應(yīng)用,在技術(shù)棧各層都有關(guān)鍵自研技術(shù)。 智源研究院作為人工智能領(lǐng)…
在這個(gè) Berkerly UR5 Demonstration Dataset 場景中,即使是 GPT-4o 或人類,都無法從單張 RGB圖像中判斷機(jī)械爪是否碰到了目標(biāo)物體,比如借助深度信息,將深度圖直接給 …
獲悉,此前,小米集團(tuán)和機(jī)器人泰斗王田苗,投了一家具身智能科技公司「小雨智造」。 據(jù)了解,「小雨智造」的核心創(chuàng)始團(tuán)隊(duì)也曾是小米曾經(jīng)的高層:「小雨智造」創(chuàng)始人喬忠良是小米的初創(chuàng)成員之一,曾經(jīng)是MIUI研發(fā)…
王仲遠(yuǎn)告訴 AI 科技評(píng)論,智源在做的事是解決這一痛點(diǎn),當(dāng)某家廠商需要訓(xùn)練萬億乃至更大規(guī)模參數(shù)模型的時(shí)候,無需從頭去解決收斂等一系列問題,開源社區(qū)中有一個(gè)好的初始化的版本,這時(shí)再基于更強(qiáng)的算力和數(shù)據(jù)量即可對模…
6月中旬,智源研究院旗下的 FlagEval 大模型評(píng)測平臺(tái)發(fā)布最新榜單:在有標(biāo)準(zhǔn)答案的“客觀評(píng)測”中,GPT-4 以76.11分在閉源大模型
11/24 16:08
11/24 16:07
10/31 16:58
10/31 16:56