具身智能的哲學(xué)反思②｜閆宏秀、宋勝男：基于“認(rèn)知—語(yǔ)言—價(jià)值”三重對(duì)齊的具身智能構(gòu)建

閆宏秀（上海交通大學(xué)馬克思主義學(xué)院、數(shù)字化未來(lái)與價(jià)值研究中心教授、博士生導(dǎo)師）、宋勝男（上海交通大學(xué)馬克思主義學(xué)院博士研究生）

2025-05-29 13:58

來(lái)源：澎湃新聞

近期，大模型和人形機(jī)器人備受社會(huì)各界關(guān)注，很多人在思考：如何讓二者有效“融合”切實(shí)推動(dòng)具身智能的發(fā)展？顧名思義，具身智能是具有“身體”的人工智能。具身智能為大模型的應(yīng)用提供了更廣闊的平臺(tái)，使之從“賽博空間”走向物理世界；具身智能讓機(jī)器人變得更“聰明”，與人類的交流更為順暢。具身智能的發(fā)展給哲學(xué)反思帶來(lái)不少挑戰(zhàn)，本組筆談聚焦具身智能的定義、本質(zhì)特征、類型和實(shí)現(xiàn)的可能性等基本理論問(wèn)題，以期推動(dòng)該領(lǐng)域研究的進(jìn)一步發(fā)展。劉永謀、白英慧認(rèn)為，追問(wèn)具身智能的“身體”問(wèn)題，主要涉及“身體”的劃界、預(yù)裝、融合與賦能等方面，這些問(wèn)題相互交織、層層遞進(jìn)。閆宏秀、宋勝男認(rèn)為，具身智能面臨認(rèn)知偏差、語(yǔ)義鴻溝和價(jià)值判斷三大對(duì)齊難題，可通過(guò)“認(rèn)知—語(yǔ)言—價(jià)值”三重對(duì)齊框架及世界模型、語(yǔ)義扎根、倫理準(zhǔn)則具身化等具體方法，積極探索構(gòu)建協(xié)同、可信的具身智能系統(tǒng)，推進(jìn)人機(jī)深度協(xié)作。吳靜認(rèn)為，具身智能的發(fā)展不僅需要有效改變現(xiàn)有大模型發(fā)展路徑的離身限制，還必須能夠構(gòu)建更具有智能正義的世界模型。楊慶峰指出，從進(jìn)化的角度看，具身智能是揚(yáng)棄理性智能體的結(jié)果，是走向超級(jí)智能的路徑之一。具身缺失阻礙了智能進(jìn)化，擁有身體形態(tài)成為改變這一阻礙的可能，但具身智能并不能克服災(zāi)難性遺忘和有限泛化能力的瓶頸問(wèn)題。（專題特邀主持：劉永謀）

具身智能的哲學(xué)反思①｜劉永謀、白英慧：具身智能“身體”實(shí)現(xiàn)的四個(gè)環(huán)節(jié)

具身智能的哲學(xué)反思②｜閆宏秀、宋勝男：基于“認(rèn)知—語(yǔ)言—價(jià)值”三重對(duì)齊的具身智能構(gòu)建

具身智能的哲學(xué)反思③｜吳靜：智能正義視角下的具身智能

具身智能的哲學(xué)反思④｜楊慶峰：智能進(jìn)化與具身智能

具身智能的哲學(xué)反思⑤｜李恒威、秦書(shū)淵：莊子的身心論對(duì)當(dāng)代具身心智理論的啟示

本系列文章原刊《福建論壇（人文社會(huì)科學(xué)版）》2025年第4期，澎湃新聞經(jīng)授權(quán)轉(zhuǎn)載。

【摘要】具身智能發(fā)展面臨的對(duì)齊難題制約了人機(jī)協(xié)作的可能性。其中，由物理世界引發(fā)的認(rèn)知偏差、由人機(jī)語(yǔ)言隔閡引發(fā)的語(yǔ)義奠基問(wèn)題、由人機(jī)存在差異引發(fā)的價(jià)值對(duì)齊挑戰(zhàn)是具身智能對(duì)齊難題的三大表征。從“認(rèn)知—語(yǔ)言—價(jià)值”三重對(duì)齊框架來(lái)看，我們通過(guò)世界模型和因果推理構(gòu)建智能體對(duì)物理規(guī)律的常識(shí)性理解，可為智能體的行動(dòng)提供可靠的認(rèn)知理論體系；借助語(yǔ)義扎根與意圖理解，尋找自然語(yǔ)言處理的更好迭代，有助于實(shí)現(xiàn)更通暢的人機(jī)語(yǔ)言互譯，可為智能體打通語(yǔ)義方面的人機(jī)協(xié)作通道；通過(guò)倫理準(zhǔn)則具身化、倫理指令客觀化等方式，可有效促使具身智能的行動(dòng)符合以人為本、技術(shù)向善的終極倫理指南。

一般而言，對(duì)齊可與價(jià)值對(duì)齊等同。這是因?yàn)閺募夹g(shù)價(jià)值論來(lái)看，價(jià)值對(duì)齊直接體現(xiàn)了對(duì)齊的核心目標(biāo)，即確保人工智能系統(tǒng)的行為與人類的價(jià)值觀、意圖和利益保持一致；而從狹義的技術(shù)研究視角來(lái)看，“在人工智能系統(tǒng)生命周期中的對(duì)齊保證，包括安全評(píng)估、可解釋性和人類價(jià)值契合性驗(yàn)證”，即價(jià)值對(duì)齊可被視為對(duì)齊的一種。不過(guò)，具身智能的對(duì)齊比這種一般意義上的對(duì)齊有更繁雜和特殊的含義。與傳統(tǒng)人工智能不同，具身智能重在利用“身體”與“智能”的有效融合，從而感知環(huán)境和理解世界。這種融合實(shí)際上就是力圖將多方要素對(duì)齊。易言之，具身智能需要實(shí)現(xiàn)從初步認(rèn)知物理規(guī)律到深入理解人類概念、從計(jì)算機(jī)語(yǔ)言和人類語(yǔ)言的隔閡到無(wú)障礙溝通、從人機(jī)差異難題到智能體與物理交互意圖相一致等多個(gè)維度的對(duì)齊。因此，具身智能對(duì)齊不僅指的是價(jià)值對(duì)齊，同時(shí)也指具身智能之“智能”所包含的認(rèn)知、語(yǔ)言方面的對(duì)齊。基于“認(rèn)知—語(yǔ)言—價(jià)值”的對(duì)齊框架，進(jìn)而實(shí)現(xiàn)具身智能“身體”與“智能”的協(xié)同，最終實(shí)現(xiàn)整體性對(duì)齊，這是構(gòu)建可信任的協(xié)同具身智能的有效路徑。

一、具身智能對(duì)齊難題

在具身智能的進(jìn)一步發(fā)展中，當(dāng)“通過(guò)數(shù)據(jù)向機(jī)器人傳授物理定律是阻礙機(jī)器人在日常生活中廣泛應(yīng)用的直接障礙”時(shí)，采用基于“身體”的方式代替?zhèn)鹘y(tǒng)的數(shù)據(jù)訓(xùn)練將成為一種重要的路徑。隨著具身智能技術(shù)不斷向工業(yè)制造場(chǎng)景和服務(wù)業(yè)場(chǎng)景的延伸，“身體”的重要性日益凸顯。為避免具身智能技術(shù)在與人類協(xié)作過(guò)程中因“身體”在物理環(huán)境中的操作失誤而對(duì)人類造成傷害，就必須確保具身智能對(duì)齊，而對(duì)具身智能對(duì)齊難題的考察恰恰是實(shí)現(xiàn)上述對(duì)齊的必要條件。具體而言，這種考察可以以難題的緣起與表征為切入點(diǎn)。

（一）由物理世界復(fù)雜性引發(fā)的認(rèn)知偏差

在人工智能領(lǐng)域，對(duì)物理世界運(yùn)動(dòng)規(guī)律的精準(zhǔn)把握一直是研究者們追求的目標(biāo)。而在具身智能領(lǐng)域中，作為這種追求更深刻的反映，研究者們?cè)诟兄夹g(shù)、數(shù)據(jù)處理與分析、算法與控制、交互與適應(yīng)等方面表現(xiàn)出迫切的理論和技術(shù)需求。與此同時(shí)，由于具身的特殊性，人工智能體對(duì)物理世界運(yùn)動(dòng)規(guī)律的理解變得比以往更加重要。以往人工智能的理解錯(cuò)誤只表現(xiàn)為文本或者視頻產(chǎn)生的邏輯矛盾和規(guī)律混淆，并不會(huì)導(dǎo)致嚴(yán)重后果，但是我們對(duì)具身智能的要求卻不能有絲毫怠慢。具身智能體需要在真實(shí)的物理環(huán)境中完成動(dòng)作，稍微的認(rèn)知偏差都可能危及人類的生命和財(cái)產(chǎn)，如機(jī)械臂的抓取失誤造成物件損壞、運(yùn)輸機(jī)器人失控碰撞行人、具身穿戴式設(shè)備產(chǎn)生異常動(dòng)作從而直接造成人體損傷等。這類錯(cuò)誤如果不能及時(shí)修復(fù)，還會(huì)對(duì)人機(jī)交互的基礎(chǔ)信任環(huán)境造成破壞。為了避免嚴(yán)重后果，“將工人從危險(xiǎn)的工作環(huán)境中解放出來(lái)，轉(zhuǎn)而安排他們從事更安全、更具戰(zhàn)略意義的工作；讓工人遠(yuǎn)離高風(fēng)險(xiǎn)工作，轉(zhuǎn)而擔(dān)任監(jiān)督崗位來(lái)提高生產(chǎn)力”，但這只是對(duì)技術(shù)脆弱性的補(bǔ)充和修正，并沒(méi)有消除癥結(jié)。因?yàn)榇朔N認(rèn)知偏差主要源于人工智能對(duì)人類的模擬尚有缺陷。

自人工智能概念誕生以來(lái)，模擬人類大腦的實(shí)驗(yàn)探索便從未停止。像人類那樣通過(guò)對(duì)世界的持續(xù)觀察進(jìn)行歸納和演繹，并且通過(guò)概念進(jìn)行交流和思考，仍然是人工智能的發(fā)展方向，但現(xiàn)有的具身人工智側(cè)重于從模仿人類行為的角度出發(fā)，忽視了思維的非邏輯性和感性特質(zhì)。在未來(lái)，具身智能體的應(yīng)用場(chǎng)景將擴(kuò)展至家庭服務(wù)、工業(yè)制造、醫(yī)療養(yǎng)護(hù)、教育娛樂(lè)和公共服務(wù)等領(lǐng)域，這意味著具身智能與人類的交互程度將會(huì)逐步加深。因此，具身智能的研究會(huì)更加注重具身智能與環(huán)境的互動(dòng)，以及“身體”在認(rèn)知過(guò)程中的作用，這也意味著具身智能終將超越以人類經(jīng)驗(yàn)和認(rèn)知學(xué)習(xí)為中心的模擬方法，實(shí)現(xiàn)新的人類認(rèn)知模擬系統(tǒng)。

（二）由人機(jī)語(yǔ)言隔閡引發(fā)的語(yǔ)義奠基問(wèn)題

語(yǔ)言是認(rèn)知過(guò)程中不可或缺的要素，它使具身智能在理解的基礎(chǔ)上推動(dòng)“身體”去執(zhí)行復(fù)雜的任務(wù)，與人類進(jìn)行有效的互動(dòng)。然而，從認(rèn)知科學(xué)的角度來(lái)看，人們對(duì)于自身所處世界的常識(shí)性概念描述與計(jì)算機(jī)所掌握的語(yǔ)言概念之間很難取得一致。這種不一致在具身智能領(lǐng)域尤為突出，具身智能模擬人類通過(guò)“身體”進(jìn)行認(rèn)知的方式存在明顯的概念互通問(wèn)題，這又對(duì)深度學(xué)習(xí)等技術(shù)過(guò)程產(chǎn)生影響，因此，人類語(yǔ)言與機(jī)器語(yǔ)言的交互也存在不可避免的理解問(wèn)題。

在ChatGPT出現(xiàn)以前，“學(xué)術(shù)界和工業(yè)界普遍認(rèn)為，在感知智能和創(chuàng)作智能之間，還需要經(jīng)過(guò)認(rèn)知智能和決策（預(yù)測(cè)）智能的發(fā)展階段”。然而，技術(shù)的高速進(jìn)展使得大語(yǔ)言模型的能力取得了跨越式進(jìn)步。例如，Sora的推出實(shí)現(xiàn)了“在未顯式引入現(xiàn)實(shí)世界物理定律的基礎(chǔ)上，僅通過(guò)在大量數(shù)據(jù)上的學(xué)習(xí)，就實(shí)現(xiàn)了對(duì)現(xiàn)實(shí)世界物理現(xiàn)象的模擬和仿真，進(jìn)一步拉近了虛擬和現(xiàn)實(shí)之間的距離”。從當(dāng)前的技術(shù)發(fā)展態(tài)勢(shì)來(lái)看，大語(yǔ)言模型已經(jīng)具備了生成聲音、圖像、文字、視頻等多種模態(tài)作品的能力。但若深究的話，大語(yǔ)言模型實(shí)際上對(duì)人的指令的理解程度很有限，并且時(shí)常會(huì)給出與人類期望相差較大的答案，甚至在一些簡(jiǎn)單的問(wèn)題理解上也有較大偏差。所以，這類使用場(chǎng)景就要求使用者具有能夠發(fā)出使大語(yǔ)言模型更加讀得懂的指令的能力，進(jìn)而增加了使用門(mén)檻。事實(shí)上，大語(yǔ)言模型主要是依賴海量數(shù)據(jù)的訓(xùn)練來(lái)模擬人類的表達(dá)與產(chǎn)出，而非真正參透人類語(yǔ)言的內(nèi)在邏輯、語(yǔ)義情境及文化內(nèi)涵，即僅僅是基于數(shù)據(jù)規(guī)律的機(jī)械模仿。在具身智能領(lǐng)域中，由于大語(yǔ)言模型的嵌入和更加專門(mén)化、場(chǎng)景化的具身智能應(yīng)用，這一局限性將會(huì)更加明顯。

（三）由人機(jī)存在差異引發(fā)的價(jià)值對(duì)齊挑戰(zhàn)

在概念、語(yǔ)言和認(rèn)知交互的基礎(chǔ)之上，我們會(huì)要求具身智能的價(jià)值判斷與人類一致，并且能夠在實(shí)際行動(dòng)中切實(shí)體現(xiàn)這些價(jià)值判斷。“數(shù)字計(jì)算機(jī)能否向我們作出關(guān)于人心的正確描述？”這一關(guān)鍵性問(wèn)題直擊計(jì)算機(jī)與人類之間的本質(zhì)差異，即心腦構(gòu)造的基質(zhì)差異。毫無(wú)疑問(wèn)，在當(dāng)下，憑借數(shù)據(jù)驅(qū)動(dòng)，計(jì)算機(jī)確實(shí)能夠在很大程度上模擬人類的智能行為，如精準(zhǔn)地完成各類復(fù)雜任務(wù)、對(duì)信息進(jìn)行快速處理等。然而，由電子元件、芯片等構(gòu)成的計(jì)算機(jī)與由血肉、神經(jīng)元等組成的人類截然不同。計(jì)算機(jī)若要與人類實(shí)現(xiàn)真正意義上的協(xié)作，必須能夠精準(zhǔn)地識(shí)別并理解人類內(nèi)心的真實(shí)意圖，并且在價(jià)值觀層面與人類達(dá)成一致，這是具身智能建立人機(jī)信任的重要基礎(chǔ)。

為具身智能系統(tǒng)制定一套普遍且通用的價(jià)值規(guī)范存在較大挑戰(zhàn)。一方面，價(jià)值觀是復(fù)雜且多維的，無(wú)法用清單的方式針對(duì)不同的場(chǎng)景和問(wèn)題向機(jī)器逐一列明和展現(xiàn)。另一方面，“對(duì)我們的終極目標(biāo)識(shí)別和編碼都非常困難，因?yàn)槿祟惸繕?biāo)的表現(xiàn)形式非常復(fù)雜”。顯然，用數(shù)據(jù)訓(xùn)練的方式要求計(jì)算機(jī)理解人類語(yǔ)言中的幸福、道德、責(zé)任等概念在技術(shù)實(shí)現(xiàn)上有很大局限。大量的數(shù)據(jù)實(shí)例只是讓計(jì)算機(jī)習(xí)得解決模式，而非理解語(yǔ)言，行動(dòng)目的的達(dá)成并不代表行動(dòng)邏輯的一致和理解的實(shí)現(xiàn)。

二、具身智能對(duì)齊的“認(rèn)知—語(yǔ)言—價(jià)值”三重框架

人機(jī)在認(rèn)知、語(yǔ)言和價(jià)值判斷上的本質(zhì)差異將影響最終的整體性對(duì)齊。“具身”意味著“感知與運(yùn)動(dòng)（motor）過(guò)程、知覺(jué)與行動(dòng)本質(zhì)上在活生生的（lived）認(rèn)知中是不可分離的”。這種不可分離需要高度的統(tǒng)一與協(xié)同。不難發(fā)現(xiàn)，“認(rèn)知—語(yǔ)言—價(jià)值”恰恰是蘊(yùn)藏在其“身體”背后的核心框架。

（一）認(rèn)知對(duì)齊：從行為模仿到概念理解的有效轉(zhuǎn)換

從人工智能的發(fā)展史來(lái)看，抽象符號(hào)如何通過(guò)物理交互轉(zhuǎn)變?yōu)檎鎸?shí)語(yǔ)義，一直是人工智能研究需要攻克的核心問(wèn)題。由于具身智能的突破性進(jìn)展，這個(gè)曾經(jīng)象征著質(zhì)性跨越（從外在模仿到內(nèi)在理解）的難題或許在不久的將來(lái)不再困擾研究者。正如波士頓動(dòng)力的Atlas機(jī)器人通過(guò)28個(gè)自由度（新版本的Atlas機(jī)器人的自由度數(shù)據(jù)未公開(kāi)）的動(dòng)態(tài)平衡獲得空間認(rèn)知，特斯拉的Optimus在操作物體時(shí)建構(gòu)物理直覺(jué)，此類技術(shù)突破印證了梅洛-龐蒂的知覺(jué)現(xiàn)象學(xué)論斷——認(rèn)知是“身體”投射到環(huán)境中的具身化實(shí)踐——正是解題的正確思路。不過(guò)，計(jì)算機(jī)系統(tǒng)對(duì)生物認(rèn)知的模擬仍面臨本質(zhì)上的局限。現(xiàn)有的具身認(rèn)知研究一方面關(guān)注“身體”的感知和“身體”在運(yùn)動(dòng)過(guò)程中與世界的交互，另一方面憑借深度學(xué)習(xí)的技術(shù)使用多層神經(jīng)網(wǎng)絡(luò)來(lái)模擬人類大腦的思維過(guò)程，這看似雙管齊下、相得益彰，實(shí)際上使“身體”與“大腦”的協(xié)同或者說(shuō)模塊整合變得比以往更加復(fù)雜了。可以說(shuō)，相關(guān)的研究越深入，所呈現(xiàn)的機(jī)器與碳基生物的差別就越明顯。從技術(shù)路徑來(lái)看，要使計(jì)算機(jī)系統(tǒng)與心智相連，似乎只能通過(guò)創(chuàng)新和強(qiáng)化算法從而加強(qiáng)概念的關(guān)聯(lián)與調(diào)節(jié)來(lái)實(shí)現(xiàn)，但由“暴力計(jì)算”構(gòu)建的超強(qiáng)智能認(rèn)知模式很可能更難以對(duì)齊人類的認(rèn)知模式。

（二）語(yǔ)言對(duì)齊：從語(yǔ)言形式到語(yǔ)義表達(dá)的有效切換

在具身智能的發(fā)展中，語(yǔ)言對(duì)齊是實(shí)現(xiàn)跨模態(tài)交互的關(guān)鍵挑戰(zhàn)之一。良好的語(yǔ)言能力是智能的標(biāo)志，因而從語(yǔ)義的有效切換到無(wú)縫對(duì)接是具身智能未來(lái)發(fā)展的目標(biāo)之一。生成式大語(yǔ)言模型的突破性進(jìn)展引發(fā)了我們對(duì)機(jī)器“語(yǔ)言掌握”的重新審視。“在人機(jī)對(duì)話過(guò)程中，大語(yǔ)言模型通過(guò)識(shí)別人類主體的意圖來(lái)回應(yīng)人類對(duì)話者，這也是人機(jī)成功溝通的關(guān)鍵。”從約翰·塞爾提出的“強(qiáng)人工智能”的視角看，大語(yǔ)言模型的開(kāi)放域?qū)υ捘芰Ρ砻髌涑醪骄邆淞艘鈭D識(shí)別和心理狀態(tài)的推理能力。但是，具身智能在語(yǔ)言理解方面不能僅僅停留在文本交互的層面。在真實(shí)的物理場(chǎng)景中，自然語(yǔ)言需要準(zhǔn)確地轉(zhuǎn)化為具體的動(dòng)作指令，這對(duì)我們完成不同模態(tài)間的語(yǔ)義對(duì)齊任務(wù)提出了更高的要求。畢竟，計(jì)算機(jī)語(yǔ)言與人類自然語(yǔ)言存在異構(gòu)性，其表現(xiàn)為：一方面，從自然語(yǔ)言到動(dòng)作指令的轉(zhuǎn)換需要解決人類語(yǔ)義的模糊性問(wèn)題；另一方面，通過(guò)傳感器接收到的多模態(tài)語(yǔ)言表征需要進(jìn)一步協(xié)同。人類語(yǔ)言通過(guò)文化語(yǔ)境構(gòu)建意義，而計(jì)算機(jī)語(yǔ)言依賴形式化邏輯系統(tǒng)進(jìn)行表征。因此，實(shí)現(xiàn)計(jì)算機(jī)語(yǔ)言與人類自然語(yǔ)言對(duì)齊的關(guān)鍵在于確保大語(yǔ)言模型的輸出符合人類的期望和價(jià)值觀。當(dāng)前計(jì)算機(jī)的“反饋—強(qiáng)化”機(jī)制是幫助計(jì)算機(jī)不斷習(xí)得人類偏好設(shè)置的有效途徑，該機(jī)制在最終決策上似乎可以做到無(wú)限接近，但為了適應(yīng)更開(kāi)放、更隨機(jī)的場(chǎng)景，更為重要的是在指令輸入的階段能找到使計(jì)算機(jī)語(yǔ)言與人類自然語(yǔ)言對(duì)齊的有效方法。

（三）價(jià)值對(duì)齊：從純智能體到物理交互的有效設(shè)計(jì)

安全可信的具身智能構(gòu)建必須考慮其負(fù)面效應(yīng)。“對(duì)技術(shù)的負(fù)面效應(yīng)進(jìn)行技術(shù)防范、控制以及制度層面的規(guī)約，只能解決表層問(wèn)題，更為深層的解決方案則在于價(jià)值觀的轉(zhuǎn)換。”針對(duì)上述對(duì)齊難題及其表征，具身智能的價(jià)值對(duì)齊需在認(rèn)知和語(yǔ)言對(duì)齊的基礎(chǔ)上，打通更高層級(jí)的對(duì)齊通路。因此，必須基于具身智能對(duì)齊難題與“認(rèn)知—語(yǔ)言—價(jià)值”三重對(duì)齊框架的關(guān)聯(lián)性（見(jiàn)表1）構(gòu)建三位一體的對(duì)齊框架。

表1

具身智能通常要面對(duì)大量物理介入的場(chǎng)景。在諸如使用機(jī)械臂、輔助人體增強(qiáng)功能的穿戴設(shè)備等類型的簡(jiǎn)單使用場(chǎng)景中，具身智能的設(shè)計(jì)被要求以人類生命安全為宗旨，形成設(shè)計(jì)的硬約束。而在更復(fù)雜的應(yīng)用場(chǎng)景中，來(lái)自人類反饋的強(qiáng)化學(xué)習(xí)（RLHF）技術(shù)展示出極大潛力。“反饋是為了使人工智能系統(tǒng)與人類意圖相符而提供給人工智能系統(tǒng)的信息”，系統(tǒng)通過(guò)大量的使用反饋進(jìn)行反向推理，從而調(diào)整策略，修正具身智能體的行為，使其逐漸接近人類的價(jià)值行為模式并從行為結(jié)果上倒推出應(yīng)該遵循的人類價(jià)值規(guī)范。在這一過(guò)程中，人類也應(yīng)該相應(yīng)地樹(shù)立正確的價(jià)值觀念，并且梳理自己的價(jià)值指令，提供給人工智能可靠的價(jià)值選擇與判斷指南。如果把具身智能的價(jià)值對(duì)齊作為一項(xiàng)框架性任務(wù)的話，認(rèn)知對(duì)齊和語(yǔ)言對(duì)齊應(yīng)該作為能夠使具身智能體與人類之間實(shí)現(xiàn)順暢語(yǔ)言交互與意圖理解的基礎(chǔ)對(duì)齊層級(jí)；而價(jià)值對(duì)齊作為頂層約束層級(jí)，確保具身智能體在深層的倫理和道德層面與人類保持一致，從而在復(fù)雜開(kāi)放的環(huán)境中做出符合人類利益和價(jià)值的決策。

三、基于協(xié)同視角破解具身智能的對(duì)齊難題

具身智能在認(rèn)知、語(yǔ)言和價(jià)值層面與人類的差異使得單向的對(duì)象化處理方式和單一的技術(shù)化處理方式都難以滿足我們的對(duì)齊需求。若想確保具身智能在認(rèn)知層面精準(zhǔn)地理解世界、在語(yǔ)言層面與人類有效溝通、在價(jià)值層面符合人類的利益和倫理準(zhǔn)則，我們就必須基于協(xié)同視角破解對(duì)齊難題。

（一）促進(jìn)協(xié)同秩序的進(jìn)化發(fā)展

具身智能的產(chǎn)生意味著人工智能認(rèn)識(shí)世界的范式發(fā)生了變化。首先，不同類型的智能對(duì)象與日俱增。例如，智能體（Agent）、具身智能（Embodied Artificial Intelligence,EAI）、大語(yǔ)言模型（Large Language Models,LLM）等已經(jīng)相繼出現(xiàn)。其次，不同智能之間的交互形式變得越發(fā)復(fù)雜，人工智能與人類的交互方式呈現(xiàn)出多模態(tài)（Multimodal）、具身化（Embodied）、嵌入式等新的特點(diǎn)。最后，由于智能對(duì)象和交互環(huán)境的多樣性，以及協(xié)同經(jīng)驗(yàn)的缺乏，研究合作的局限性問(wèn)題日漸凸顯。

“自然界萬(wàn)事萬(wàn)物通過(guò)‘自組織’（Self-organizing）合作，產(chǎn)生協(xié)同秩序效果”，具身智能的研究必然也會(huì)經(jīng)歷從無(wú)序走向有序的過(guò)程。目前具身智能發(fā)展正處于大膽探索期，無(wú)序現(xiàn)象在所難免，此時(shí)的協(xié)同并非多方能力的簡(jiǎn)單疊加，而是具有“多方協(xié)作、系統(tǒng)運(yùn)行和整體高效”等特征的合作。這種合作基于智能對(duì)象不斷增多和智能交互復(fù)雜度增加所提出的方案，需要主體間緊密的協(xié)調(diào)與配合，在訓(xùn)練過(guò)程中不斷根據(jù)整體的情況對(duì)各部分進(jìn)行克制與增強(qiáng)。通過(guò)理論與系統(tǒng)、系統(tǒng)與環(huán)境、人類與機(jī)器、感知與決策、決策與執(zhí)行、倫理與責(zé)任、多模態(tài)呈現(xiàn)等多方面的協(xié)同，我們可以預(yù)見(jiàn)具身智能的研究最終會(huì)走向有序和可靠。

（二）確保可信任的人機(jī)協(xié)同

具身智能通過(guò)“身體”進(jìn)行感知，為人工智能的發(fā)展帶來(lái)了新的范式可能，促使研究者在人與人工智能的合作方式上作出改變。具身智能的傳感系統(tǒng)、控制系統(tǒng)等成為人們理解世界的新的工具，具身智能通過(guò)“身體”形成的認(rèn)知方式為人們改進(jìn)自身的認(rèn)知方式提供了某種參照。由于人與機(jī)器的構(gòu)成基質(zhì)不同，具身智能獲得關(guān)于世界的認(rèn)知在某些方面要遠(yuǎn)超人類，今后的具身智能不再被人們視為簡(jiǎn)單工具，而是能夠與人類共同協(xié)作、各取所長(zhǎng)的合作伙伴。

為了避免具身智能在人機(jī)合作中對(duì)人類造成傷害，研究者需要加強(qiáng)具身智能的操作可信度。“可信任人工智能的構(gòu)建發(fā)端于人對(duì)技術(shù)倫理旨趣的審度，可信任的存在邏輯在于人工智能創(chuàng)建了基于任務(wù)和基于目標(biāo)信任得以產(chǎn)生的可能條件，并在與人類的交互之中呈現(xiàn)出某種關(guān)聯(lián)性的信任。”具身智能在達(dá)成人類目標(biāo)的過(guò)程中必須適應(yīng)其“身體”帶來(lái)的新的合作方式和對(duì)齊要求，以避免對(duì)人類產(chǎn)生實(shí)體侵害和倫理侵害。因此，人類對(duì)具身智能提出可信的需求是協(xié)同運(yùn)作的必然保證。不過(guò)，可以預(yù)見(jiàn)的是，在具身智能快速發(fā)展的過(guò)程中，我們不得不面對(duì)一個(gè)問(wèn)題：如何在系統(tǒng)的脆弱性與目標(biāo)對(duì)齊之間找到平衡，實(shí)現(xiàn)有效的人機(jī)協(xié)同，構(gòu)建可信任的具身智能系統(tǒng)？這個(gè)問(wèn)題的答案很可能與世界模型有關(guān)。

（三）重視世界模型的模擬機(jī)制

相較于抽象的算法主義，具身智能的技術(shù)路線呈現(xiàn)出更加鮮明的實(shí)在論特征，其發(fā)展需要物理“身體”隨著周邊環(huán)境的變化而實(shí)現(xiàn)動(dòng)態(tài)耦合，如機(jī)械臂的觸覺(jué)反應(yīng)等，而非將智能化簡(jiǎn)化為脫離現(xiàn)實(shí)載體的純算法邏輯。這種具身實(shí)在論導(dǎo)向的技術(shù)路線，本質(zhì)上是對(duì)傳統(tǒng)人工智能封閉訓(xùn)練環(huán)境的變革，即通過(guò)多模態(tài)的感知，從局部模塊化協(xié)作走向系統(tǒng)的人機(jī)協(xié)同。

在這一過(guò)程中，世界模型（World Model）提供給具身智能較好的虛擬現(xiàn)實(shí)條件，幫助具身智能獲得對(duì)真實(shí)世界的理解。“世界模型”最早由何大衛(wèi)（DavidHa）和尤爾根·施密德胡伯（Jürgen Schmidhuber）提出，但他們并未明確“世界模型”的具體含義。一般認(rèn)為，“世界模型可以被理解為心智模型的一個(gè)計(jì)算實(shí)例，這是一個(gè)借用自認(rèn)知心理學(xué)的概念。心智模型是一個(gè)關(guān)于世界動(dòng)態(tài)的預(yù)測(cè)模型，也就是說(shuō)，是我們基于自身感知所建立的一種抽象表征”。易言之，它通過(guò)內(nèi)部表征來(lái)預(yù)測(cè)環(huán)境的動(dòng)態(tài)變化，從而幫助AI系統(tǒng)在復(fù)雜環(huán)境中進(jìn)行決策和規(guī)劃。這一概念逐漸在具身智能領(lǐng)域獲得重視，可以幫助具身智能在虛擬環(huán)境中學(xué)習(xí)，并將學(xué)到的知識(shí)運(yùn)用于現(xiàn)實(shí)世界，完成虛擬空間訓(xùn)練與實(shí)際環(huán)境操作的順暢切換。如果說(shuō)，推理、預(yù)測(cè)以及快速反應(yīng)是生物在長(zhǎng)期進(jìn)化過(guò)程中逐漸發(fā)展出來(lái)的關(guān)鍵能力的話，那么世界模型就為具身智能系統(tǒng)提供了具備這種能力的可能。同時(shí)，具身智能在掌握這種能力的基礎(chǔ)上利用技術(shù)優(yōu)勢(shì)突破人類感官的生理局限，可以對(duì)世界的抽象規(guī)律作出更好的推理和預(yù)測(cè)，最終代替人類進(jìn)行判斷和決策，實(shí)現(xiàn)從真實(shí)環(huán)境學(xué)習(xí)到虛擬環(huán)境訓(xùn)練再到真實(shí)環(huán)境操作的跨空間協(xié)同的一系列進(jìn)化。”

責(zé)任編輯：龔思量

圖片編輯：張穎

澎湃新聞報(bào)料：021-962866

澎湃新聞，未經(jīng)授權(quán)不得轉(zhuǎn)載

我要舉報(bào)

#具身智能 #認(rèn)知—語(yǔ)言—價(jià)值三重對(duì)齊框架 #世界模型