- +1
算法周刊·前沿掃描|對(duì)話(huà)董樂(lè):小數(shù)據(jù)為何熱門(mén)?如何思考通用人工智能?
“小數(shù)據(jù)”逐漸熱門(mén),背后是技術(shù)演進(jìn)的自然結(jié)果還是“大數(shù)據(jù)”碰壁后的重新選擇?認(rèn)知智能世界里的“暗物質(zhì)”是什么?我們?cè)撊绾纹诖退伎纪ㄓ萌斯ぶ悄埽?/p>
“我們是世界上比較早研究大數(shù)據(jù)問(wèn)題的團(tuán)隊(duì),差不多在17年前(2004年)就開(kāi)始做大數(shù)據(jù)領(lǐng)域的研究。研究了大概三四年以后就發(fā)現(xiàn)大數(shù)據(jù)存在一些固有的問(wèn)題,當(dāng)時(shí)預(yù)見(jiàn)到這些問(wèn)題用感知智能是無(wú)法解決的。后來(lái)我們就開(kāi)始嘗試范式轉(zhuǎn)換,從2009年開(kāi)始研究認(rèn)知智能。”近日,北京通用人工智能研究院常務(wù)副院長(zhǎng)董樂(lè)接受澎湃新聞(www.kxwhcb.com)采訪(fǎng)時(shí)表示。

北京通用人工智能研究院定位為非營(yíng)利性的新型研發(fā)機(jī)構(gòu),由北京市政府、科技部支持共建,北京大學(xué)、清華大學(xué)等單位合作支撐,由全球著名計(jì)算機(jī)視覺(jué)專(zhuān)家、統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)家、人工智能專(zhuān)家朱松純教授于2020年籌建并擔(dān)任院長(zhǎng)。其目標(biāo)是實(shí)現(xiàn)具有自主的感知、認(rèn)知、決策、學(xué)習(xí)、執(zhí)行和社會(huì)協(xié)作能力,符合人類(lèi)情感、倫理與道德觀(guān)念的通用智能體。
董樂(lè)闡述道,目前大家看到比較多的AI采用的是“大數(shù)據(jù)+算力+深度學(xué)習(xí)”范式,屬于感知層的智能,在真正產(chǎn)業(yè)落地時(shí),當(dāng)前的感知智能遇到了很多問(wèn)題,比如只能做特定的人類(lèi)事先定義的任務(wù),存在長(zhǎng)尾效應(yīng)、訓(xùn)練成本高的問(wèn)題,大量數(shù)據(jù)標(biāo)注牽扯到隱私與安全性問(wèn)題,此外還存在模型的不可解釋、不能交流、算法偏見(jiàn)等各種問(wèn)題。
“現(xiàn)在大家慢慢形成了共識(shí),認(rèn)知智能可能才是下一個(gè)10年人工智能要重點(diǎn)發(fā)展的方向。”董樂(lè)教授表示。
怎么理解認(rèn)知智能與感知智能?
“烏鴉范式”和“鸚鵡范式”
日本一位野生動(dòng)物學(xué)家采集了野生烏鴉的很多日常生活習(xí)性視頻。他發(fā)現(xiàn),當(dāng)野生烏鴉來(lái)到城市,它需要堅(jiān)果飽腹但又沒(méi)有辦法打開(kāi)堅(jiān)果。這時(shí),它有個(gè)很偶然的發(fā)現(xiàn),把堅(jiān)果扔到路上,汽車(chē)開(kāi)過(guò)去后堅(jiān)果被碾碎了,就可以直接過(guò)去吃。

但它在去吃的過(guò)程中又面臨一個(gè)新問(wèn)題,馬路上很危險(xiǎn),它要怎么完成這個(gè)任務(wù)?很聰明的是,它又發(fā)現(xiàn)信號(hào)燈,當(dāng)紅燈的時(shí)候,所有車(chē)都停下來(lái),它就把堅(jiān)果扔到斑馬線(xiàn)上,堅(jiān)果被車(chē)輪碾破,等信號(hào)燈指示,車(chē)都停了再下來(lái)把堅(jiān)果吃了。
“所有這一系列動(dòng)作都是它自主完成,通過(guò)要解決一個(gè)任務(wù)——安全吃到堅(jiān)果,它進(jìn)行了觀(guān)察、推理,發(fā)現(xiàn)了交通的規(guī)律,然后去執(zhí)行和決策。我們把這稱(chēng)之為‘烏鴉范式’,即“小數(shù)據(jù),大任務(wù)”范式。它沒(méi)有很高的訓(xùn)練成本,也不需要太多的數(shù)據(jù)訓(xùn)練,但它要完成一個(gè)任務(wù)目標(biāo),所以它是由任務(wù)驅(qū)動(dòng)的。”董樂(lè)說(shuō)道。
與“烏鴉范式”相對(duì)的就是“鸚鵡范式”,鸚鵡需要大量的數(shù)據(jù)反復(fù)訓(xùn)練,教給他什么它就說(shuō)什么。它可以不斷重復(fù),但并不理解其中含義,它不能反映現(xiàn)實(shí)中的因果邏輯,是“大數(shù)據(jù),小任務(wù)”范式。
在認(rèn)知智能視野下,人工智能系統(tǒng)的三個(gè)關(guān)鍵要素是“架構(gòu)、任務(wù)和數(shù)據(jù)”。董樂(lè)認(rèn)為,相比于感知智能所強(qiáng)調(diào)的“數(shù)據(jù)、算力和模型”,這是又向前演進(jìn)了一步。其中,架構(gòu)最重要。“就像判斷一個(gè)人的能力,并不是來(lái)自他掌握了多少知識(shí),而是他有很完整的知識(shí)構(gòu)建模型能力,那么即便目前擁有的知識(shí)不夠多,但到一個(gè)新的領(lǐng)域,有了這樣健全的架構(gòu)也可以迅速習(xí)得新知識(shí)。我們認(rèn)為架構(gòu)是基礎(chǔ),任務(wù)是關(guān)鍵,在這個(gè)過(guò)程中數(shù)據(jù)起了一部分作用,但并不是全部的作用。”
比如訓(xùn)練AI完成椅子識(shí)別的任務(wù)。如果按照感知智能深度學(xué)習(xí)的范式,需要把大量椅子圖像中的特征標(biāo)注出來(lái),再讓AI學(xué)習(xí)。但此后,遇到異形的椅子,依然會(huì)出現(xiàn)難以識(shí)別的情況。“不光是單純的物體識(shí)別,在包括無(wú)人駕駛和醫(yī)療等領(lǐng)域,都會(huì)遇到類(lèi)似的問(wèn)題。”董樂(lè)表示。
但人不需要看過(guò)很多椅子也很容易做出是否是椅子的判斷,人是如何做的呢?
董樂(lè)概括道,“我們?nèi)藭?huì)把這個(gè)任務(wù)從單純的物體識(shí)別問(wèn)題上升到對(duì)任務(wù)的理解的高度。通過(guò)視覺(jué)感知和物理想象進(jìn)行判斷,也就是說(shuō)我們看到它,就可以想象它能不能承受讓我安全地坐,以及坐上去舒不舒服,就這么簡(jiǎn)單。”
董樂(lè)曾在BEYOND國(guó)際科技創(chuàng)新博覽會(huì)的論壇中提到認(rèn)知智能世界里的“暗物質(zhì)”。她認(rèn)為,在日常生活中,我們很容易感知到視覺(jué)等感官的信息輸入,但這只是冰山一角。“在感官背后的推理、想象其實(shí)發(fā)揮了巨大能量,我們將其稱(chēng)作‘智能暗物質(zhì)’。我們會(huì)對(duì)物理和社會(huì)常識(shí)進(jìn)行理解、推理,然后結(jié)合時(shí)空、因果模型作用在現(xiàn)實(shí)場(chǎng)景中,把感知和認(rèn)知進(jìn)行融合。”
AI可以學(xué)習(xí)人類(lèi)這種把看不見(jiàn)的知識(shí)提煉出來(lái)的抽象能力,基于這樣“Dark Beyond Deep”的范式轉(zhuǎn)化,即通過(guò)少量數(shù)據(jù)完成“大任務(wù)”,以少量樣本、簡(jiǎn)單標(biāo)注,做到舉一反百,以感知智能和認(rèn)知智能相結(jié)合的方式來(lái)理解世界,探索智能“暗物質(zhì)”。
對(duì)于“小數(shù)據(jù)”逐漸熱門(mén),背后是技術(shù)演進(jìn)的自然結(jié)果?還是“大數(shù)據(jù)”碰壁后的重新選擇?董樂(lè)認(rèn)為,兩個(gè)層面都有。
“我們不否定大數(shù)據(jù),大數(shù)據(jù)在很多場(chǎng)景上確實(shí)有很大價(jià)值,但是在另外一些場(chǎng)景上怎么辦?同時(shí)還有數(shù)據(jù)問(wèn)題,成本問(wèn)題,能耗問(wèn)題……用大數(shù)據(jù)去解決一些根本不用大數(shù)據(jù)就能解決的問(wèn)題,其實(shí)是非常不科學(xué)的。”董樂(lè)對(duì)澎湃新聞(www.kxwhcb.com)表示。
如果粗略對(duì)比鸚鵡范式烏鴉范式的效能,董樂(lè)說(shuō)道,“鸚鵡范式可能是2:8,即通用能力大約只有20%,還需要按任務(wù)要求對(duì)80%的能力進(jìn)行個(gè)性化定制;烏鴉范式則是8:2,通用能力達(dá)到80%,只有20%的能力需要按任務(wù)要求進(jìn)行優(yōu)化迭代。”
對(duì)于是否認(rèn)可人工智能前進(jìn)道路中類(lèi)腦智能的研究路線(xiàn),董樂(lè)對(duì)澎湃新聞(www.kxwhcb.com)談到,“如果拋開(kāi)要解決的問(wèn)題和任務(wù),單純討論一個(gè)技術(shù)范式或者說(shuō)一種路徑,我認(rèn)為意義和價(jià)值都不大。每一條技術(shù)路徑都有它探索和研究的某種必要性,單純?nèi)フf(shuō)哪條路徑可能有問(wèn)題,或者有人有質(zhì)疑,這都不足為奇,關(guān)鍵的是要解決什么問(wèn)題,要把任務(wù)確定好。”
董樂(lè)以登山做比喻,從山腳往山頂有很多路,周?chē)娘L(fēng)景也不同,過(guò)程中要解決的問(wèn)題也不一樣,現(xiàn)在從山底下往上看的時(shí)候,沒(méi)有辦法去評(píng)判哪條路是最好的。可能只有真正到了上面以后,再回過(guò)頭來(lái)思考這個(gè)問(wèn)題。
通用人工智能是像人一樣的“人造智能”嗎?
2014年,物理學(xué)家斯蒂芬·威廉·霍金(Stephen William Hawking)在接受英國(guó)廣播公司(BBC)采訪(fǎng)時(shí)曾表示了對(duì)一個(gè)“像人”的人工智能的擔(dān)憂(yōu),“制造能夠思考的機(jī)器無(wú)疑是對(duì)人類(lèi)自身存在的巨大威脅。當(dāng)人工智能發(fā)展完全,就將是人類(lèi)的末日。”

此后幾年,霍金也在多次演講中表達(dá)了這樣的看法。2017年,霍金在接受英國(guó)《泰晤士報(bào)》采訪(fǎng)時(shí)更是發(fā)出警告,“人工智能進(jìn)一步發(fā)展便可能會(huì)通過(guò)核戰(zhàn)爭(zhēng)或生物戰(zhàn)爭(zhēng)摧毀人類(lèi)。人類(lèi)需要利用邏輯和理性去控制未來(lái)可能出現(xiàn)的威脅。”
那么在當(dāng)下,我們?cè)谟懻撏ㄓ萌斯ぶ悄軙r(shí)指向的是霍金所擔(dān)憂(yōu)的人工智能嗎?
中國(guó)科學(xué)院院士、清華大學(xué)人工智能研究院院長(zhǎng)張鈸曾在第五屆中國(guó)人工智能大會(huì)上表示,“通用人工智能的發(fā)展是好事,真發(fā)展出來(lái)了也是喜事,但是這里不能把通用人工智能和強(qiáng)人工智能混淆。”
南京大學(xué)人工智能學(xué)院院長(zhǎng)周志華曾在《中國(guó)計(jì)算機(jī)學(xué)會(huì)通訊》2018年第1期《專(zhuān)欄》里將“強(qiáng)人工智能”描述為,達(dá)到甚至超越人類(lèi)智慧水平的人造物,具有心智和意識(shí)、能根據(jù)自己的意圖開(kāi)展行動(dòng)的“人造智能”。“通用人工智能”則是希望借鑒人類(lèi)的智能行為,研制出更好的工具以減輕人類(lèi)智力勞動(dòng),其實(shí)質(zhì)是行為智能和任務(wù)智能,本質(zhì)還是“弱人工智能”,類(lèi)似于“高級(jí)仿生學(xué)”。
“人工智能技術(shù)現(xiàn)在所取得的進(jìn)展和成功,是緣于‘弱人工智能’而不是‘強(qiáng)人工智能’的研究”,周志華稱(chēng),“從技術(shù)上來(lái)說(shuō),主流人工智能學(xué)界的努力從來(lái)就不是朝向強(qiáng)人工智能,現(xiàn)有技術(shù)的發(fā)展也不會(huì)自動(dòng)地使強(qiáng)人工智能成為可能。”
國(guó)際人工智能聯(lián)合會(huì)前主席、牛津大學(xué)計(jì)算機(jī)系主任邁克爾·伍德里奇(Michael Wooldrige)曾在2016年CCF-GAIR大會(huì)報(bào)告中說(shuō),強(qiáng)人工智能“幾乎沒(méi)有進(jìn)展”,“幾乎沒(méi)有嚴(yán)肅的活動(dòng)”(little progress, little serious activity)。
“通用人工智能是根據(jù)任務(wù)驅(qū)動(dòng),目前在有限邊界內(nèi)進(jìn)行的,就像我們?nèi)艘粯樱说哪芰σ彩怯羞吔绲摹!倍瓨?lè)對(duì)澎湃新聞(www.thepaepr.cn)表示。
什么樣才能達(dá)到真正所說(shuō)的通用人工智能?董樂(lè)認(rèn)為,實(shí)際上是一個(gè)使命,一個(gè)方向,它不斷讓智能體以更加通用化的方式解決問(wèn)題。第一個(gè)體現(xiàn)是,智能體能夠具備普遍意義上的常識(shí)推理能力,大概百分之八九十的任務(wù)都能做到準(zhǔn)確理解、并能實(shí)現(xiàn)。第二是一項(xiàng)技術(shù)基本在具有同樣邏輯的場(chǎng)景中都能通用。
“例如在醫(yī)療、教育、金融,包括能源等領(lǐng)域都有大量的資源匹配的問(wèn)題,決策者需要根據(jù)有限的信息實(shí)時(shí)做出預(yù)測(cè),因此分析光快不行,要準(zhǔn)確,準(zhǔn)確以后還要全面,要分析出原因,這樣才能更清晰更合理,”董樂(lè)表示,“我們的認(rèn)知AI通用智能體,它起到的作用實(shí)際上就是把這些綜合的信息,更合理化地給到需要的人手里,幫助決策者,更好、更公平地統(tǒng)籌、分配資源,做出最科學(xué)的決策。”
在當(dāng)下,很多企業(yè)也在借助人工智能完成智能化轉(zhuǎn)型。記者走訪(fǎng)中發(fā)現(xiàn),對(duì)于要不要自建AI團(tuán)隊(duì),很多轉(zhuǎn)型中的企業(yè)是有猶豫的。 “目前會(huì)看到很多國(guó)家企業(yè)也都面臨這樣的問(wèn)題,一個(gè)是數(shù)據(jù)能不能給,第二是自己的專(zhuān)業(yè)能力能不能夠。”董樂(lè)對(duì)澎湃新聞(www.kxwhcb.com)表示。
董樂(lè)認(rèn)為,“如果只是一個(gè)企業(yè)的應(yīng)用,應(yīng)該去跟專(zhuān)業(yè)團(tuán)隊(duì)合作。AI人才本身很緊缺,成本很高,如果沒(méi)有很強(qiáng)的科學(xué)研究和工程化能力,最后會(huì)發(fā)現(xiàn)投入越來(lái)越多但產(chǎn)出不明顯。如果從企業(yè)戰(zhàn)略層面考慮要布局自己的AI團(tuán)隊(duì),這是另外一個(gè)問(wèn)題。單純從結(jié)果的產(chǎn)出導(dǎo)向來(lái)說(shuō),我認(rèn)為對(duì)于大部分的企業(yè)來(lái)說(shuō)沒(méi)有必要組建自己的專(zhuān)業(yè)AI隊(duì)伍,找到一個(gè)優(yōu)秀的專(zhuān)業(yè)團(tuán)隊(duì),搭建好的合作模式,各自做各自擅長(zhǎng)的事才是最優(yōu)解。”
談到AI對(duì)人類(lèi)和社會(huì)福祉的幫助,董樂(lè)表示,實(shí)際上就是用技術(shù)的方式打破不平衡的、可能帶來(lái)浪費(fèi)和損耗的資源分配方式,使社會(huì)整體的運(yùn)轉(zhuǎn)效率得到智能化提升。“我們認(rèn)為在未來(lái)50年必將產(chǎn)生人工智能與人類(lèi)文明的碰撞與融合。其實(shí)對(duì)所有社會(huì)治理者,包括我們每一個(gè)人都要去思考,智能時(shí)代的社會(huì),我們要去面臨什么?”






- 報(bào)料熱線(xiàn): 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116
? 2014-2025 上海東方報(bào)業(yè)有限公司