- +1
北京智源發(fā)布悟道3.0大模型,院長(zhǎng)黃鐵軍:實(shí)現(xiàn)AGI有三條路線
·要實(shí)現(xiàn)AGI,有三條技術(shù)路線:第一是“大數(shù)據(jù)+自監(jiān)督學(xué)習(xí)+大算力”形成的信息類(lèi)模型;第二是具身智能,是基于虛擬世界或真實(shí)世界、通過(guò)強(qiáng)化學(xué)習(xí)訓(xùn)練出來(lái)的具身模型;第三是腦智能,直接“抄自然進(jìn)化的作業(yè)”,復(fù)制出數(shù)字版本的智能體。
·據(jù)智源初步統(tǒng)計(jì),今年以來(lái)大語(yǔ)言模型開(kāi)源的項(xiàng)目,全世界范圍內(nèi)共有42項(xiàng),中國(guó)有9項(xiàng)。“相比之下,我認(rèn)為我們的開(kāi)源開(kāi)放力度還遠(yuǎn)遠(yuǎn)不夠。”

北京智源人工智能研究院院長(zhǎng)黃鐵軍。
6月9日,北京智源人工智能研究院(以下簡(jiǎn)稱(chēng)智源)院長(zhǎng)黃鐵軍在2023北京智源大會(huì)上作報(bào)告,發(fā)布悟道3.0大模型系列,并宣布進(jìn)入全面開(kāi)源的新階段。此次悟道3.0包含悟道·天鷹(Aquila)語(yǔ)言大模型系列、“天秤(FlagEval)”大語(yǔ)言評(píng)測(cè)體系及開(kāi)放平臺(tái)以及悟道·視界視覺(jué)大模型系列。
黃鐵軍在演講中表示,要實(shí)現(xiàn)通用人工智能(AGI),有三條技術(shù)路線:第一是“大數(shù)據(jù)+自監(jiān)督學(xué)習(xí)+大算力”形成的信息類(lèi)模型;第二是具身智能,是基于虛擬世界或真實(shí)世界、通過(guò)強(qiáng)化學(xué)習(xí)訓(xùn)練出來(lái)的具身模型;第三是腦智能,直接“抄自然進(jìn)化的作業(yè)”,復(fù)制出數(shù)字版本的智能體。
OpenAI做GPT(生成式預(yù)訓(xùn)練Transformer模型)就遵循第一條技術(shù)路線;以谷歌DeepMind的DQN(深度Q網(wǎng)絡(luò),Deep Q-network)為核心取得的一系列進(jìn)展即基于第二條技術(shù)路線。
“從夢(mèng)想角度來(lái)說(shuō),智源期望不同于前兩個(gè)技術(shù)路線,從‘第一性原理’出發(fā)。從原子到有機(jī)分子、到神經(jīng)系統(tǒng)、到身體,構(gòu)建一個(gè)完整的智能系統(tǒng)AGI。這是一個(gè)大概20年才可能實(shí)現(xiàn)的目標(biāo),所以智源作為新型研發(fā)機(jī)構(gòu)平臺(tái),在三個(gè)方向都在開(kāi)展工作。”黃鐵軍的這段描述也梳理了此次多項(xiàng)發(fā)布的背后邏輯,分別包括大模型方向、具身方向,以及智源自己期望方向的進(jìn)展。
悟道3.0大模型系列
北京智源人工智能研究院是國(guó)內(nèi)最早系統(tǒng)化布局大模型的科研機(jī)構(gòu),2021年3月和6月,智源在兩個(gè)多月時(shí)間里先后發(fā)布悟道1.0和悟道2.0。悟道1.0是我國(guó)首個(gè)超大規(guī)模智能模型系統(tǒng),悟道2.0參數(shù)規(guī)模更是達(dá)到1.75萬(wàn)億,是當(dāng)時(shí)中國(guó)首個(gè)、全球最大的萬(wàn)億級(jí)模型。
黃鐵軍認(rèn)為,大模型有三個(gè)特點(diǎn):第一是規(guī)模大,神經(jīng)網(wǎng)絡(luò)參數(shù)達(dá)到百億規(guī)模以上。第二是涌現(xiàn)性,產(chǎn)生預(yù)料之外的新能力。第三是通用性,不限于單類(lèi)問(wèn)題或?qū)iT(mén)領(lǐng)域,能夠解決各類(lèi)問(wèn)題。
自悟道2.0開(kāi)始,智源就不僅僅研發(fā)模型。據(jù)黃鐵軍介紹,智源更偏向于構(gòu)建以大模型為核心的生態(tài),包括底層數(shù)據(jù)處理和匯聚、模型能力和算法評(píng)測(cè)、開(kāi)源開(kāi)放,形成一套高效的大模型技術(shù)和算法體系。
黃鐵軍認(rèn)為,現(xiàn)在的智能時(shí)代是開(kāi)源開(kāi)放的時(shí)代,一個(gè)封閉的生態(tài)很難長(zhǎng)遠(yuǎn)發(fā)展下去。開(kāi)源的生態(tài)在軟件上要開(kāi)源,在硬件上要開(kāi)放,既要競(jìng)爭(zhēng)又要合作,這會(huì)是一個(gè)千千萬(wàn)萬(wàn)企業(yè)共同競(jìng)爭(zhēng)、共同合作營(yíng)造出來(lái)的開(kāi)源開(kāi)放的生態(tài)體系。
據(jù)智源初步統(tǒng)計(jì),今年以來(lái)語(yǔ)言大模型開(kāi)源的項(xiàng)目,全世界范圍內(nèi)共有42項(xiàng),中國(guó)有9項(xiàng)。“相比之下,我認(rèn)為我們的開(kāi)源開(kāi)放力度還不夠。開(kāi)源開(kāi)放也是競(jìng)爭(zhēng),好算法應(yīng)該公開(kāi)評(píng)測(cè)比較才能證明技術(shù)水平,而不是僅靠結(jié)果來(lái)說(shuō)優(yōu)秀與否。”黃鐵軍說(shuō)。
在悟道3.0大模型系列中,智源發(fā)布并全面開(kāi)源悟道·天鷹(Aquila)語(yǔ)言大模型系列和悟道·視界視覺(jué)大模型系列,與多個(gè)高校和科研院所合作構(gòu)建“天秤(FlagEval)”大語(yǔ)言評(píng)測(cè)體系及開(kāi)放平臺(tái),還有FlagOpen飛智大模型技術(shù)開(kāi)源體系。
據(jù)黃鐵軍介紹,悟道·天鷹語(yǔ)言大模型是第一個(gè)中英文雙語(yǔ)、支持商用、符合數(shù)據(jù)合規(guī)要求的大模型。通過(guò)數(shù)據(jù)質(zhì)量控制和多種訓(xùn)練優(yōu)化,悟道·天鷹(Aquila)實(shí)現(xiàn)了在更小數(shù)據(jù)集、更短訓(xùn)練時(shí)間獲得比其他開(kāi)源模型更優(yōu)的性能。這是系列模型,這次發(fā)布了70億參數(shù)和330億參數(shù)的基礎(chǔ)模型,以及AquilaChat對(duì)話模型(類(lèi)ChatGPT模型),AquilaCode文本代碼生成大模型(70億參數(shù))。
此外,對(duì)于大模型的評(píng)測(cè)是當(dāng)下生成式人工智能發(fā)展中的一個(gè)難點(diǎn)。此次智源發(fā)布“天秤(FlagEval)”大語(yǔ)言評(píng)測(cè)體系及開(kāi)放平臺(tái),希望協(xié)助研究人員全方位評(píng)估基礎(chǔ)模型及訓(xùn)練算法的性能,同時(shí)探索利用AI方法對(duì)主觀評(píng)測(cè)進(jìn)行輔助,大幅提升評(píng)測(cè)的效率和客觀性。
具體而言,天秤(FlagEval)大語(yǔ)言評(píng)測(cè)體系構(gòu)建了“能力-任務(wù)-指標(biāo)”三維評(píng)測(cè)框架,測(cè)評(píng)30多種能力,5種任務(wù)以及4大類(lèi)指標(biāo)構(gòu)成的超過(guò)600個(gè)維度,其中包括22個(gè)主觀和客觀評(píng)測(cè)數(shù)據(jù)集,以及84433道題目。天秤評(píng)測(cè)平臺(tái)已經(jīng)開(kāi)放,提供在線和離線評(píng)測(cè)。目前已支持英偉達(dá)、寒武紀(jì)、昆侖、昇騰等多種芯片架構(gòu),以及PyTorch、MindSpore深度學(xué)習(xí)框架。
在視覺(jué)大模型方面,此次智源大會(huì)直接放出6項(xiàng)成果,包括在多模態(tài)序列中補(bǔ)全一切的多模態(tài)大模型Emu、最強(qiáng)十億級(jí)視覺(jué)基礎(chǔ)模型EVA、性能最強(qiáng)開(kāi)源CLIP模型EVA-CLIP、首創(chuàng)了上下文圖像學(xué)習(xí)技術(shù)路徑的通用視覺(jué)模型Painter、分割一切的視界通用分割模型、以及首個(gè)零樣本視頻編輯方法vid2vid -zero。
具身多模態(tài)交互模型和類(lèi)腦智能
“我們探索在虛擬世界中讓智能體學(xué)習(xí)完成用各種語(yǔ)言描述的任務(wù),比如告訴智能體制作一個(gè)石錘子,建造一個(gè)木質(zhì)的避難所。也就是說(shuō)告知它一個(gè)任務(wù),它就可以不用鼠標(biāo)控制而在游戲世界里自己完成。這是通用人工智能的一個(gè)新賽道,全世界范圍內(nèi)有不少機(jī)構(gòu)在嘗試。”黃鐵軍說(shuō)。
目前的方法主要依賴(lài)人類(lèi)的知識(shí)和提示,下一個(gè)目標(biāo)是讓智能體在此基礎(chǔ)上學(xué)習(xí)策略集和在專(zhuān)門(mén)針對(duì)多模態(tài)交互的大模型方面進(jìn)一步研究,從而讓它在開(kāi)放世界中自適應(yīng)完成更多任務(wù),并且具備自己的創(chuàng)造力。
“在類(lèi)腦智能和生命模擬的方向,我們的工作也在繼續(xù),去年智源大會(huì)發(fā)布了最高精度的仿真線蟲(chóng),這到現(xiàn)在為止仍然是精度最高的,論文正在評(píng)審過(guò)程中。”黃鐵軍說(shuō),有了這個(gè)工作基礎(chǔ),我們把仿真線蟲(chóng)所用的生命模擬平臺(tái)“Evaluation天演”全面開(kāi)源,并提供在線服務(wù)。
天演平臺(tái)有四項(xiàng)最顯著的特點(diǎn):第一,是當(dāng)今效率最高的精細(xì)神經(jīng)系統(tǒng)仿真平臺(tái);第二,支持超大規(guī)模的神經(jīng)網(wǎng)絡(luò)仿真,目前已經(jīng)高效地復(fù)現(xiàn)了領(lǐng)域內(nèi)多個(gè)大規(guī)模的神經(jīng)模型;第三,提供在線工具,只要有生物數(shù)據(jù)就可以一站式的建模、仿真、可視化,“可視化是天演獨(dú)有的,可以觀察神經(jīng)系統(tǒng)在運(yùn)行過(guò)程中信號(hào)發(fā)生了怎樣的變化。我們最終想知道生命智能的每一步,每個(gè)細(xì)節(jié),而不像今天的黑箱。”黃鐵軍說(shuō)。
目前,在三條技術(shù)路線中,大模型的進(jìn)展最快。為何如此?黃鐵軍認(rèn)為,主要是語(yǔ)言數(shù)據(jù),無(wú)論是論文、圖書(shū)還是代碼,資源都非常豐富且質(zhì)量高,從海量數(shù)據(jù)中發(fā)現(xiàn)內(nèi)在蘊(yùn)含的規(guī)律正是大模型的優(yōu)勢(shì)。
不過(guò),黃鐵軍繼續(xù)說(shuō)道,人腦可以看成脈沖神經(jīng)網(wǎng)絡(luò),與今天的大模型有本質(zhì)區(qū)別,想要AI產(chǎn)生類(lèi)似人腦的能力,光靠大模型一個(gè)方向是遠(yuǎn)遠(yuǎn)不夠的。從基礎(chǔ)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)到信號(hào)加工機(jī)理的類(lèi)腦智能是一個(gè)方向,讓智能體有物理身體與環(huán)境互動(dòng)的具身智能是另一個(gè)方向。
作為大模型領(lǐng)域年度巔峰盛會(huì),智源大會(huì)至今已經(jīng)舉辦了五屆。今年大會(huì)共同主席為智源人工智能研究院理事長(zhǎng)張宏江,以及加州大學(xué)伯克利分校教授、智源學(xué)術(shù)顧問(wèn)委員邁克爾·喬丹(Michael I. Jordan)。共同程序主席為智源人工智能研究院院長(zhǎng)黃鐵軍,以及清華大學(xué)教授、智源首席科學(xué)家朱軍。
本屆大會(huì)邀請(qǐng)到了圖靈獎(jiǎng)得主杰弗里·辛頓(Geoffrey Hinton)、楊立昆(Yann LeCun)、約瑟夫·斯發(fā)基斯(Joseph Sifakis)和姚期智,OpenAI首席執(zhí)行官山姆·奧特曼(Sam Altman)、加州大學(xué)伯克利分校人工智能系統(tǒng)中心創(chuàng)始人斯圖爾特·羅素(Stuart Russell)、中國(guó)科學(xué)院院士張鈸及中國(guó)工程院院士鄭南寧、中國(guó)工程院外籍院士、美國(guó)藝術(shù)與科學(xué)院院士張亞勤、Midjourney創(chuàng)始人大衛(wèi)·霍爾茲(David Holz)等嘉賓,共議人工智能前沿與熱點(diǎn)話題。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116
? 2014-2025 上海東方報(bào)業(yè)有限公司