▓成人丝瓜视频▓无码免费,99精品国产一区二区三区不卡 ,大长腿白丝被c到爽哭视频 ,高清无码内谢

澎湃Logo
下載客戶端

登錄

  • +1

具身智能的哲學(xué)反思②|閆宏秀、宋勝男:基于“認(rèn)知—語(yǔ)言—價(jià)值”三重對(duì)齊的具身智能構(gòu)建

閆宏秀(上海交通大學(xué)馬克思主義學(xué)院、數(shù)字化未來(lái)與價(jià)值研究中心教授、博士生導(dǎo)師)、宋勝男(上海交通大學(xué)馬克思主義學(xué)院博士研究生)
2025-05-29 13:58
來(lái)源:澎湃新聞
? 思想市場(chǎng) >
字號(hào)

近期,大模型和人形機(jī)器人備受社會(huì)各界關(guān)注,很多人在思考:如何讓二者有效“融合”切實(shí)推動(dòng)具身智能的發(fā)展?顧名思義,具身智能是具有“身體”的人工智能。具身智能為大模型的應(yīng)用提供了更廣闊的平臺(tái),使之從“賽博空間”走向物理世界;具身智能讓機(jī)器人變得更“聰明”,與人類的交流更為順暢。具身智能的發(fā)展給哲學(xué)反思帶來(lái)不少挑戰(zhàn),本組筆談聚焦具身智能的定義、本質(zhì)特征、類型和實(shí)現(xiàn)的可能性等基本理論問(wèn)題,以期推動(dòng)該領(lǐng)域研究的進(jìn)一步發(fā)展。劉永謀、白英慧認(rèn)為,追問(wèn)具身智能的“身體”問(wèn)題,主要涉及“身體”的劃界、預(yù)裝、融合與賦能等方面,這些問(wèn)題相互交織、層層遞進(jìn)。閆宏秀、宋勝男認(rèn)為,具身智能面臨認(rèn)知偏差、語(yǔ)義鴻溝和價(jià)值判斷三大對(duì)齊難題,可通過(guò)“認(rèn)知—語(yǔ)言—價(jià)值”三重對(duì)齊框架及世界模型、語(yǔ)義扎根、倫理準(zhǔn)則具身化等具體方法,積極探索構(gòu)建協(xié)同、可信的具身智能系統(tǒng),推進(jìn)人機(jī)深度協(xié)作。吳靜認(rèn)為,具身智能的發(fā)展不僅需要有效改變現(xiàn)有大模型發(fā)展路徑的離身限制,還必須能夠構(gòu)建更具有智能正義的世界模型。楊慶峰指出,從進(jìn)化的角度看,具身智能是揚(yáng)棄理性智能體的結(jié)果,是走向超級(jí)智能的路徑之一。具身缺失阻礙了智能進(jìn)化,擁有身體形態(tài)成為改變這一阻礙的可能,但具身智能并不能克服災(zāi)難性遺忘和有限泛化能力的瓶頸問(wèn)題。(專題特邀主持:劉永謀)

具身智能的哲學(xué)反思①|劉永謀、白英慧:具身智能“身體”實(shí)現(xiàn)的四個(gè)環(huán)節(jié)

具身智能的哲學(xué)反思②|閆宏秀、宋勝男:基于“認(rèn)知—語(yǔ)言—價(jià)值”三重對(duì)齊的具身智能構(gòu)建

具身智能的哲學(xué)反思③|吳靜:智能正義視角下的具身智能

具身智能的哲學(xué)反思④|楊慶峰:智能進(jìn)化與具身智能

具身智能的哲學(xué)反思⑤|李恒威、秦書(shū)淵:莊子的身心論對(duì)當(dāng)代具身心智理論的啟示

本系列文章原刊《福建論壇(人文社會(huì)科學(xué)版)》2025年第4期,澎湃新聞經(jīng)授權(quán)轉(zhuǎn)載。

【摘要】具身智能發(fā)展面臨的對(duì)齊難題制約了人機(jī)協(xié)作的可能性。其中,由物理世界引發(fā)的認(rèn)知偏差、由人機(jī)語(yǔ)言隔閡引發(fā)的語(yǔ)義奠基問(wèn)題、由人機(jī)存在差異引發(fā)的價(jià)值對(duì)齊挑戰(zhàn)是具身智能對(duì)齊難題的三大表征。從“認(rèn)知—語(yǔ)言—價(jià)值”三重對(duì)齊框架來(lái)看,我們通過(guò)世界模型和因果推理構(gòu)建智能體對(duì)物理規(guī)律的常識(shí)性理解,可為智能體的行動(dòng)提供可靠的認(rèn)知理論體系;借助語(yǔ)義扎根與意圖理解,尋找自然語(yǔ)言處理的更好迭代,有助于實(shí)現(xiàn)更通暢的人機(jī)語(yǔ)言互譯,可為智能體打通語(yǔ)義方面的人機(jī)協(xié)作通道;通過(guò)倫理準(zhǔn)則具身化、倫理指令客觀化等方式,可有效促使具身智能的行動(dòng)符合以人為本、技術(shù)向善的終極倫理指南。

一般而言,對(duì)齊可與價(jià)值對(duì)齊等同。這是因?yàn)閺募夹g(shù)價(jià)值論來(lái)看,價(jià)值對(duì)齊直接體現(xiàn)了對(duì)齊的核心目標(biāo),即確保人工智能系統(tǒng)的行為與人類的價(jià)值觀、意圖和利益保持一致;而從狹義的技術(shù)研究視角來(lái)看,“在人工智能系統(tǒng)生命周期中的對(duì)齊保證,包括安全評(píng)估、可解釋性和人類價(jià)值契合性驗(yàn)證”,即價(jià)值對(duì)齊可被視為對(duì)齊的一種。不過(guò),具身智能的對(duì)齊比這種一般意義上的對(duì)齊有更繁雜和特殊的含義。與傳統(tǒng)人工智能不同,具身智能重在利用“身體”與“智能”的有效融合,從而感知環(huán)境和理解世界。這種融合實(shí)際上就是力圖將多方要素對(duì)齊。易言之,具身智能需要實(shí)現(xiàn)從初步認(rèn)知物理規(guī)律到深入理解人類概念、從計(jì)算機(jī)語(yǔ)言和人類語(yǔ)言的隔閡到無(wú)障礙溝通、從人機(jī)差異難題到智能體與物理交互意圖相一致等多個(gè)維度的對(duì)齊。因此,具身智能對(duì)齊不僅指的是價(jià)值對(duì)齊,同時(shí)也指具身智能之“智能”所包含的認(rèn)知、語(yǔ)言方面的對(duì)齊。基于“認(rèn)知—語(yǔ)言—價(jià)值”的對(duì)齊框架,進(jìn)而實(shí)現(xiàn)具身智能“身體”與“智能”的協(xié)同,最終實(shí)現(xiàn)整體性對(duì)齊,這是構(gòu)建可信任的協(xié)同具身智能的有效路徑。

一、具身智能對(duì)齊難題

在具身智能的進(jìn)一步發(fā)展中,當(dāng)“通過(guò)數(shù)據(jù)向機(jī)器人傳授物理定律是阻礙機(jī)器人在日常生活中廣泛應(yīng)用的直接障礙”時(shí),采用基于“身體”的方式代替?zhèn)鹘y(tǒng)的數(shù)據(jù)訓(xùn)練將成為一種重要的路徑。隨著具身智能技術(shù)不斷向工業(yè)制造場(chǎng)景和服務(wù)業(yè)場(chǎng)景的延伸,“身體”的重要性日益凸顯。為避免具身智能技術(shù)在與人類協(xié)作過(guò)程中因“身體”在物理環(huán)境中的操作失誤而對(duì)人類造成傷害,就必須確保具身智能對(duì)齊,而對(duì)具身智能對(duì)齊難題的考察恰恰是實(shí)現(xiàn)上述對(duì)齊的必要條件。具體而言,這種考察可以以難題的緣起與表征為切入點(diǎn)。

(一)由物理世界復(fù)雜性引發(fā)的認(rèn)知偏差

在人工智能領(lǐng)域,對(duì)物理世界運(yùn)動(dòng)規(guī)律的精準(zhǔn)把握一直是研究者們追求的目標(biāo)。而在具身智能領(lǐng)域中,作為這種追求更深刻的反映,研究者們?cè)诟兄夹g(shù)、數(shù)據(jù)處理與分析、算法與控制、交互與適應(yīng)等方面表現(xiàn)出迫切的理論和技術(shù)需求。與此同時(shí),由于具身的特殊性,人工智能體對(duì)物理世界運(yùn)動(dòng)規(guī)律的理解變得比以往更加重要。以往人工智能的理解錯(cuò)誤只表現(xiàn)為文本或者視頻產(chǎn)生的邏輯矛盾和規(guī)律混淆,并不會(huì)導(dǎo)致嚴(yán)重后果,但是我們對(duì)具身智能的要求卻不能有絲毫怠慢。具身智能體需要在真實(shí)的物理環(huán)境中完成動(dòng)作,稍微的認(rèn)知偏差都可能危及人類的生命和財(cái)產(chǎn),如機(jī)械臂的抓取失誤造成物件損壞、運(yùn)輸機(jī)器人失控碰撞行人、具身穿戴式設(shè)備產(chǎn)生異常動(dòng)作從而直接造成人體損傷等。這類錯(cuò)誤如果不能及時(shí)修復(fù),還會(huì)對(duì)人機(jī)交互的基礎(chǔ)信任環(huán)境造成破壞。為了避免嚴(yán)重后果,“將工人從危險(xiǎn)的工作環(huán)境中解放出來(lái),轉(zhuǎn)而安排他們從事更安全、更具戰(zhàn)略意義的工作;讓工人遠(yuǎn)離高風(fēng)險(xiǎn)工作,轉(zhuǎn)而擔(dān)任監(jiān)督崗位來(lái)提高生產(chǎn)力”,但這只是對(duì)技術(shù)脆弱性的補(bǔ)充和修正,并沒(méi)有消除癥結(jié)。因?yàn)榇朔N認(rèn)知偏差主要源于人工智能對(duì)人類的模擬尚有缺陷。

自人工智能概念誕生以來(lái),模擬人類大腦的實(shí)驗(yàn)探索便從未停止。像人類那樣通過(guò)對(duì)世界的持續(xù)觀察進(jìn)行歸納和演繹,并且通過(guò)概念進(jìn)行交流和思考,仍然是人工智能的發(fā)展方向,但現(xiàn)有的具身人工智側(cè)重于從模仿人類行為的角度出發(fā),忽視了思維的非邏輯性和感性特質(zhì)。在未來(lái),具身智能體的應(yīng)用場(chǎng)景將擴(kuò)展至家庭服務(wù)、工業(yè)制造、醫(yī)療養(yǎng)護(hù)、教育娛樂(lè)和公共服務(wù)等領(lǐng)域,這意味著具身智能與人類的交互程度將會(huì)逐步加深。因此,具身智能的研究會(huì)更加注重具身智能與環(huán)境的互動(dòng),以及“身體”在認(rèn)知過(guò)程中的作用,這也意味著具身智能終將超越以人類經(jīng)驗(yàn)和認(rèn)知學(xué)習(xí)為中心的模擬方法,實(shí)現(xiàn)新的人類認(rèn)知模擬系統(tǒng)。

(二)由人機(jī)語(yǔ)言隔閡引發(fā)的語(yǔ)義奠基問(wèn)題

語(yǔ)言是認(rèn)知過(guò)程中不可或缺的要素,它使具身智能在理解的基礎(chǔ)上推動(dòng)“身體”去執(zhí)行復(fù)雜的任務(wù),與人類進(jìn)行有效的互動(dòng)。然而,從認(rèn)知科學(xué)的角度來(lái)看,人們對(duì)于自身所處世界的常識(shí)性概念描述與計(jì)算機(jī)所掌握的語(yǔ)言概念之間很難取得一致。這種不一致在具身智能領(lǐng)域尤為突出,具身智能模擬人類通過(guò)“身體”進(jìn)行認(rèn)知的方式存在明顯的概念互通問(wèn)題,這又對(duì)深度學(xué)習(xí)等技術(shù)過(guò)程產(chǎn)生影響,因此,人類語(yǔ)言與機(jī)器語(yǔ)言的交互也存在不可避免的理解問(wèn)題。

在ChatGPT出現(xiàn)以前,“學(xué)術(shù)界和工業(yè)界普遍認(rèn)為,在感知智能和創(chuàng)作智能之間,還需要經(jīng)過(guò)認(rèn)知智能和決策(預(yù)測(cè))智能的發(fā)展階段”。然而,技術(shù)的高速進(jìn)展使得大語(yǔ)言模型的能力取得了跨越式進(jìn)步。例如,Sora的推出實(shí)現(xiàn)了“在未顯式引入現(xiàn)實(shí)世界物理定律的基礎(chǔ)上,僅通過(guò)在大量數(shù)據(jù)上的學(xué)習(xí),就實(shí)現(xiàn)了對(duì)現(xiàn)實(shí)世界物理現(xiàn)象的模擬和仿真,進(jìn)一步拉近了虛擬和現(xiàn)實(shí)之間的距離”。從當(dāng)前的技術(shù)發(fā)展態(tài)勢(shì)來(lái)看,大語(yǔ)言模型已經(jīng)具備了生成聲音、圖像、文字、視頻等多種模態(tài)作品的能力。但若深究的話,大語(yǔ)言模型實(shí)際上對(duì)人的指令的理解程度很有限,并且時(shí)常會(huì)給出與人類期望相差較大的答案,甚至在一些簡(jiǎn)單的問(wèn)題理解上也有較大偏差。所以,這類使用場(chǎng)景就要求使用者具有能夠發(fā)出使大語(yǔ)言模型更加讀得懂的指令的能力,進(jìn)而增加了使用門(mén)檻。事實(shí)上,大語(yǔ)言模型主要是依賴海量數(shù)據(jù)的訓(xùn)練來(lái)模擬人類的表達(dá)與產(chǎn)出,而非真正參透人類語(yǔ)言的內(nèi)在邏輯、語(yǔ)義情境及文化內(nèi)涵,即僅僅是基于數(shù)據(jù)規(guī)律的機(jī)械模仿。在具身智能領(lǐng)域中,由于大語(yǔ)言模型的嵌入和更加專門(mén)化、場(chǎng)景化的具身智能應(yīng)用,這一局限性將會(huì)更加明顯。

(三)由人機(jī)存在差異引發(fā)的價(jià)值對(duì)齊挑戰(zhàn)

在概念、語(yǔ)言和認(rèn)知交互的基礎(chǔ)之上,我們會(huì)要求具身智能的價(jià)值判斷與人類一致,并且能夠在實(shí)際行動(dòng)中切實(shí)體現(xiàn)這些價(jià)值判斷。“數(shù)字計(jì)算機(jī)能否向我們作出關(guān)于人心的正確描述?”這一關(guān)鍵性問(wèn)題直擊計(jì)算機(jī)與人類之間的本質(zhì)差異,即心腦構(gòu)造的基質(zhì)差異。毫無(wú)疑問(wèn),在當(dāng)下,憑借數(shù)據(jù)驅(qū)動(dòng),計(jì)算機(jī)確實(shí)能夠在很大程度上模擬人類的智能行為,如精準(zhǔn)地完成各類復(fù)雜任務(wù)、對(duì)信息進(jìn)行快速處理等。然而,由電子元件、芯片等構(gòu)成的計(jì)算機(jī)與由血肉、神經(jīng)元等組成的人類截然不同。計(jì)算機(jī)若要與人類實(shí)現(xiàn)真正意義上的協(xié)作,必須能夠精準(zhǔn)地識(shí)別并理解人類內(nèi)心的真實(shí)意圖,并且在價(jià)值觀層面與人類達(dá)成一致,這是具身智能建立人機(jī)信任的重要基礎(chǔ)。

為具身智能系統(tǒng)制定一套普遍且通用的價(jià)值規(guī)范存在較大挑戰(zhàn)。一方面,價(jià)值觀是復(fù)雜且多維的,無(wú)法用清單的方式針對(duì)不同的場(chǎng)景和問(wèn)題向機(jī)器逐一列明和展現(xiàn)。另一方面,“對(duì)我們的終極目標(biāo)識(shí)別和編碼都非常困難,因?yàn)槿祟惸繕?biāo)的表現(xiàn)形式非常復(fù)雜”。顯然,用數(shù)據(jù)訓(xùn)練的方式要求計(jì)算機(jī)理解人類語(yǔ)言中的幸福、道德、責(zé)任等概念在技術(shù)實(shí)現(xiàn)上有很大局限。大量的數(shù)據(jù)實(shí)例只是讓計(jì)算機(jī)習(xí)得解決模式,而非理解語(yǔ)言,行動(dòng)目的的達(dá)成并不代表行動(dòng)邏輯的一致和理解的實(shí)現(xiàn)。

二、具身智能對(duì)齊的“認(rèn)知—語(yǔ)言—價(jià)值”三重框架

人機(jī)在認(rèn)知、語(yǔ)言和價(jià)值判斷上的本質(zhì)差異將影響最終的整體性對(duì)齊。“具身”意味著“感知與運(yùn)動(dòng)(motor)過(guò)程、知覺(jué)與行動(dòng)本質(zhì)上在活生生的(lived)認(rèn)知中是不可分離的”。這種不可分離需要高度的統(tǒng)一與協(xié)同。不難發(fā)現(xiàn),“認(rèn)知—語(yǔ)言—價(jià)值”恰恰是蘊(yùn)藏在其“身體”背后的核心框架。

(一)認(rèn)知對(duì)齊:從行為模仿到概念理解的有效轉(zhuǎn)換

從人工智能的發(fā)展史來(lái)看,抽象符號(hào)如何通過(guò)物理交互轉(zhuǎn)變?yōu)檎鎸?shí)語(yǔ)義,一直是人工智能研究需要攻克的核心問(wèn)題。由于具身智能的突破性進(jìn)展,這個(gè)曾經(jīng)象征著質(zhì)性跨越(從外在模仿到內(nèi)在理解)的難題或許在不久的將來(lái)不再困擾研究者。正如波士頓動(dòng)力的Atlas機(jī)器人通過(guò)28個(gè)自由度(新版本的Atlas機(jī)器人的自由度數(shù)據(jù)未公開(kāi))的動(dòng)態(tài)平衡獲得空間認(rèn)知,特斯拉的Optimus在操作物體時(shí)建構(gòu)物理直覺(jué),此類技術(shù)突破印證了梅洛-龐蒂的知覺(jué)現(xiàn)象學(xué)論斷——認(rèn)知是“身體”投射到環(huán)境中的具身化實(shí)踐——正是解題的正確思路。不過(guò),計(jì)算機(jī)系統(tǒng)對(duì)生物認(rèn)知的模擬仍面臨本質(zhì)上的局限。現(xiàn)有的具身認(rèn)知研究一方面關(guān)注“身體”的感知和“身體”在運(yùn)動(dòng)過(guò)程中與世界的交互,另一方面憑借深度學(xué)習(xí)的技術(shù)使用多層神經(jīng)網(wǎng)絡(luò)來(lái)模擬人類大腦的思維過(guò)程,這看似雙管齊下、相得益彰,實(shí)際上使“身體”與“大腦”的協(xié)同或者說(shuō)模塊整合變得比以往更加復(fù)雜了。可以說(shuō),相關(guān)的研究越深入,所呈現(xiàn)的機(jī)器與碳基生物的差別就越明顯。從技術(shù)路徑來(lái)看,要使計(jì)算機(jī)系統(tǒng)與心智相連,似乎只能通過(guò)創(chuàng)新和強(qiáng)化算法從而加強(qiáng)概念的關(guān)聯(lián)與調(diào)節(jié)來(lái)實(shí)現(xiàn),但由“暴力計(jì)算”構(gòu)建的超強(qiáng)智能認(rèn)知模式很可能更難以對(duì)齊人類的認(rèn)知模式。

(二)語(yǔ)言對(duì)齊:從語(yǔ)言形式到語(yǔ)義表達(dá)的有效切換

在具身智能的發(fā)展中,語(yǔ)言對(duì)齊是實(shí)現(xiàn)跨模態(tài)交互的關(guān)鍵挑戰(zhàn)之一。良好的語(yǔ)言能力是智能的標(biāo)志,因而從語(yǔ)義的有效切換到無(wú)縫對(duì)接是具身智能未來(lái)發(fā)展的目標(biāo)之一。生成式大語(yǔ)言模型的突破性進(jìn)展引發(fā)了我們對(duì)機(jī)器“語(yǔ)言掌握”的重新審視。“在人機(jī)對(duì)話過(guò)程中,大語(yǔ)言模型通過(guò)識(shí)別人類主體的意圖來(lái)回應(yīng)人類對(duì)話者,這也是人機(jī)成功溝通的關(guān)鍵。”從約翰·塞爾提出的“強(qiáng)人工智能”的視角看,大語(yǔ)言模型的開(kāi)放域?qū)υ捘芰Ρ砻髌涑醪骄邆淞艘鈭D識(shí)別和心理狀態(tài)的推理能力。但是,具身智能在語(yǔ)言理解方面不能僅僅停留在文本交互的層面。在真實(shí)的物理場(chǎng)景中,自然語(yǔ)言需要準(zhǔn)確地轉(zhuǎn)化為具體的動(dòng)作指令,這對(duì)我們完成不同模態(tài)間的語(yǔ)義對(duì)齊任務(wù)提出了更高的要求。畢竟,計(jì)算機(jī)語(yǔ)言與人類自然語(yǔ)言存在異構(gòu)性,其表現(xiàn)為:一方面,從自然語(yǔ)言到動(dòng)作指令的轉(zhuǎn)換需要解決人類語(yǔ)義的模糊性問(wèn)題;另一方面,通過(guò)傳感器接收到的多模態(tài)語(yǔ)言表征需要進(jìn)一步協(xié)同。人類語(yǔ)言通過(guò)文化語(yǔ)境構(gòu)建意義,而計(jì)算機(jī)語(yǔ)言依賴形式化邏輯系統(tǒng)進(jìn)行表征。因此,實(shí)現(xiàn)計(jì)算機(jī)語(yǔ)言與人類自然語(yǔ)言對(duì)齊的關(guān)鍵在于確保大語(yǔ)言模型的輸出符合人類的期望和價(jià)值觀。當(dāng)前計(jì)算機(jī)的“反饋—強(qiáng)化”機(jī)制是幫助計(jì)算機(jī)不斷習(xí)得人類偏好設(shè)置的有效途徑,該機(jī)制在最終決策上似乎可以做到無(wú)限接近,但為了適應(yīng)更開(kāi)放、更隨機(jī)的場(chǎng)景,更為重要的是在指令輸入的階段能找到使計(jì)算機(jī)語(yǔ)言與人類自然語(yǔ)言對(duì)齊的有效方法。

(三)價(jià)值對(duì)齊:從純智能體到物理交互的有效設(shè)計(jì)

安全可信的具身智能構(gòu)建必須考慮其負(fù)面效應(yīng)。“對(duì)技術(shù)的負(fù)面效應(yīng)進(jìn)行技術(shù)防范、控制以及制度層面的規(guī)約,只能解決表層問(wèn)題,更為深層的解決方案則在于價(jià)值觀的轉(zhuǎn)換。”針對(duì)上述對(duì)齊難題及其表征,具身智能的價(jià)值對(duì)齊需在認(rèn)知和語(yǔ)言對(duì)齊的基礎(chǔ)上,打通更高層級(jí)的對(duì)齊通路。因此,必須基于具身智能對(duì)齊難題與“認(rèn)知—語(yǔ)言—價(jià)值”三重對(duì)齊框架的關(guān)聯(lián)性(見(jiàn)表1)構(gòu)建三位一體的對(duì)齊框架。

表1

具身智能通常要面對(duì)大量物理介入的場(chǎng)景。在諸如使用機(jī)械臂、輔助人體增強(qiáng)功能的穿戴設(shè)備等類型的簡(jiǎn)單使用場(chǎng)景中,具身智能的設(shè)計(jì)被要求以人類生命安全為宗旨,形成設(shè)計(jì)的硬約束。而在更復(fù)雜的應(yīng)用場(chǎng)景中,來(lái)自人類反饋的強(qiáng)化學(xué)習(xí)(RLHF)技術(shù)展示出極大潛力。“反饋是為了使人工智能系統(tǒng)與人類意圖相符而提供給人工智能系統(tǒng)的信息”,系統(tǒng)通過(guò)大量的使用反饋進(jìn)行反向推理,從而調(diào)整策略,修正具身智能體的行為,使其逐漸接近人類的價(jià)值行為模式并從行為結(jié)果上倒推出應(yīng)該遵循的人類價(jià)值規(guī)范。在這一過(guò)程中,人類也應(yīng)該相應(yīng)地樹(shù)立正確的價(jià)值觀念,并且梳理自己的價(jià)值指令,提供給人工智能可靠的價(jià)值選擇與判斷指南。如果把具身智能的價(jià)值對(duì)齊作為一項(xiàng)框架性任務(wù)的話,認(rèn)知對(duì)齊和語(yǔ)言對(duì)齊應(yīng)該作為能夠使具身智能體與人類之間實(shí)現(xiàn)順暢語(yǔ)言交互與意圖理解的基礎(chǔ)對(duì)齊層級(jí);而價(jià)值對(duì)齊作為頂層約束層級(jí),確保具身智能體在深層的倫理和道德層面與人類保持一致,從而在復(fù)雜開(kāi)放的環(huán)境中做出符合人類利益和價(jià)值的決策。

三、基于協(xié)同視角破解具身智能的對(duì)齊難題

具身智能在認(rèn)知、語(yǔ)言和價(jià)值層面與人類的差異使得單向的對(duì)象化處理方式和單一的技術(shù)化處理方式都難以滿足我們的對(duì)齊需求。若想確保具身智能在認(rèn)知層面精準(zhǔn)地理解世界、在語(yǔ)言層面與人類有效溝通、在價(jià)值層面符合人類的利益和倫理準(zhǔn)則,我們就必須基于協(xié)同視角破解對(duì)齊難題。

(一)促進(jìn)協(xié)同秩序的進(jìn)化發(fā)展

具身智能的產(chǎn)生意味著人工智能認(rèn)識(shí)世界的范式發(fā)生了變化。首先,不同類型的智能對(duì)象與日俱增。例如,智能體(Agent)、具身智能(Embodied Artificial Intelligence,EAI)、大語(yǔ)言模型(Large Language Models,LLM)等已經(jīng)相繼出現(xiàn)。其次,不同智能之間的交互形式變得越發(fā)復(fù)雜,人工智能與人類的交互方式呈現(xiàn)出多模態(tài)(Multimodal)、具身化(Embodied)、嵌入式等新的特點(diǎn)。最后,由于智能對(duì)象和交互環(huán)境的多樣性,以及協(xié)同經(jīng)驗(yàn)的缺乏,研究合作的局限性問(wèn)題日漸凸顯。

“自然界萬(wàn)事萬(wàn)物通過(guò)‘自組織’(Self-organizing)合作,產(chǎn)生協(xié)同秩序效果”,具身智能的研究必然也會(huì)經(jīng)歷從無(wú)序走向有序的過(guò)程。目前具身智能發(fā)展正處于大膽探索期,無(wú)序現(xiàn)象在所難免,此時(shí)的協(xié)同并非多方能力的簡(jiǎn)單疊加,而是具有“多方協(xié)作、系統(tǒng)運(yùn)行和整體高效”等特征的合作。這種合作基于智能對(duì)象不斷增多和智能交互復(fù)雜度增加所提出的方案,需要主體間緊密的協(xié)調(diào)與配合,在訓(xùn)練過(guò)程中不斷根據(jù)整體的情況對(duì)各部分進(jìn)行克制與增強(qiáng)。通過(guò)理論與系統(tǒng)、系統(tǒng)與環(huán)境、人類與機(jī)器、感知與決策、決策與執(zhí)行、倫理與責(zé)任、多模態(tài)呈現(xiàn)等多方面的協(xié)同,我們可以預(yù)見(jiàn)具身智能的研究最終會(huì)走向有序和可靠。

(二)確保可信任的人機(jī)協(xié)同

具身智能通過(guò)“身體”進(jìn)行感知,為人工智能的發(fā)展帶來(lái)了新的范式可能,促使研究者在人與人工智能的合作方式上作出改變。具身智能的傳感系統(tǒng)、控制系統(tǒng)等成為人們理解世界的新的工具,具身智能通過(guò)“身體”形成的認(rèn)知方式為人們改進(jìn)自身的認(rèn)知方式提供了某種參照。由于人與機(jī)器的構(gòu)成基質(zhì)不同,具身智能獲得關(guān)于世界的認(rèn)知在某些方面要遠(yuǎn)超人類,今后的具身智能不再被人們視為簡(jiǎn)單工具,而是能夠與人類共同協(xié)作、各取所長(zhǎng)的合作伙伴。

為了避免具身智能在人機(jī)合作中對(duì)人類造成傷害,研究者需要加強(qiáng)具身智能的操作可信度。“可信任人工智能的構(gòu)建發(fā)端于人對(duì)技術(shù)倫理旨趣的審度,可信任的存在邏輯在于人工智能創(chuàng)建了基于任務(wù)和基于目標(biāo)信任得以產(chǎn)生的可能條件,并在與人類的交互之中呈現(xiàn)出某種關(guān)聯(lián)性的信任。”具身智能在達(dá)成人類目標(biāo)的過(guò)程中必須適應(yīng)其“身體”帶來(lái)的新的合作方式和對(duì)齊要求,以避免對(duì)人類產(chǎn)生實(shí)體侵害和倫理侵害。因此,人類對(duì)具身智能提出可信的需求是協(xié)同運(yùn)作的必然保證。不過(guò),可以預(yù)見(jiàn)的是,在具身智能快速發(fā)展的過(guò)程中,我們不得不面對(duì)一個(gè)問(wèn)題:如何在系統(tǒng)的脆弱性與目標(biāo)對(duì)齊之間找到平衡,實(shí)現(xiàn)有效的人機(jī)協(xié)同,構(gòu)建可信任的具身智能系統(tǒng)?這個(gè)問(wèn)題的答案很可能與世界模型有關(guān)。

(三)重視世界模型的模擬機(jī)制

相較于抽象的算法主義,具身智能的技術(shù)路線呈現(xiàn)出更加鮮明的實(shí)在論特征,其發(fā)展需要物理“身體”隨著周邊環(huán)境的變化而實(shí)現(xiàn)動(dòng)態(tài)耦合,如機(jī)械臂的觸覺(jué)反應(yīng)等,而非將智能化簡(jiǎn)化為脫離現(xiàn)實(shí)載體的純算法邏輯。這種具身實(shí)在論導(dǎo)向的技術(shù)路線,本質(zhì)上是對(duì)傳統(tǒng)人工智能封閉訓(xùn)練環(huán)境的變革,即通過(guò)多模態(tài)的感知,從局部模塊化協(xié)作走向系統(tǒng)的人機(jī)協(xié)同。

在這一過(guò)程中,世界模型(World Model)提供給具身智能較好的虛擬現(xiàn)實(shí)條件,幫助具身智能獲得對(duì)真實(shí)世界的理解。“世界模型”最早由何大衛(wèi)(DavidHa)和尤爾根·施密德胡伯(Jürgen Schmidhuber)提出,但他們并未明確“世界模型”的具體含義。一般認(rèn)為,“世界模型可以被理解為心智模型的一個(gè)計(jì)算實(shí)例,這是一個(gè)借用自認(rèn)知心理學(xué)的概念。心智模型是一個(gè)關(guān)于世界動(dòng)態(tài)的預(yù)測(cè)模型,也就是說(shuō),是我們基于自身感知所建立的一種抽象表征”。易言之,它通過(guò)內(nèi)部表征來(lái)預(yù)測(cè)環(huán)境的動(dòng)態(tài)變化,從而幫助AI系統(tǒng)在復(fù)雜環(huán)境中進(jìn)行決策和規(guī)劃。這一概念逐漸在具身智能領(lǐng)域獲得重視,可以幫助具身智能在虛擬環(huán)境中學(xué)習(xí),并將學(xué)到的知識(shí)運(yùn)用于現(xiàn)實(shí)世界,完成虛擬空間訓(xùn)練與實(shí)際環(huán)境操作的順暢切換。如果說(shuō),推理、預(yù)測(cè)以及快速反應(yīng)是生物在長(zhǎng)期進(jìn)化過(guò)程中逐漸發(fā)展出來(lái)的關(guān)鍵能力的話,那么世界模型就為具身智能系統(tǒng)提供了具備這種能力的可能。同時(shí),具身智能在掌握這種能力的基礎(chǔ)上利用技術(shù)優(yōu)勢(shì)突破人類感官的生理局限,可以對(duì)世界的抽象規(guī)律作出更好的推理和預(yù)測(cè),最終代替人類進(jìn)行判斷和決策,實(shí)現(xiàn)從真實(shí)環(huán)境學(xué)習(xí)到虛擬環(huán)境訓(xùn)練再到真實(shí)環(huán)境操作的跨空間協(xié)同的一系列進(jìn)化。”

    責(zé)任編輯:龔思量
    圖片編輯:張穎
    澎湃新聞報(bào)料:021-962866
    澎湃新聞,未經(jīng)授權(quán)不得轉(zhuǎn)載
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號(hào)

            滬公網(wǎng)安備31010602000299號(hào)

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116

            ? 2014-2025 上海東方報(bào)業(yè)有限公司

            反饋
            主站蜘蛛池模板: 改则县| 个旧市| 张家界市| 临汾市| 鄱阳县| 板桥市| 东辽县| 册亨县| 长治县| 罗田县| 沙雅县| 武清区| 建阳市| 浏阳市| 平昌县| 汉中市| 莫力| 神池县| 栾川县| 台山市| 龙里县| 江达县| 靖远县| 连山| 南宫市| 任丘市| 石楼县| 平顺县| 额敏县| 柞水县| 龙川县| 高青县| 晋城| 从江县| 商南县| 得荣县| 鹤山市| 绥滨县| 景谷| 柞水县| 邹城市|