▓成人丝瓜视频▓无码免费,99精品国产一区二区三区不卡 ,大长腿白丝被c到爽哭视频 ,高清无码内谢

澎湃Logo
下載客戶端

登錄

  • +1

聯(lián)匯科技趙天成:具身智能的真正“涌現(xiàn)”是跨任務跨場景,中國更有機會萌生最好的本體

澎湃新聞記者 秦盛
2025-05-31 07:32
來源:澎湃新聞
? 10%公司 >
字號

“具身智能真正的‘涌現(xiàn)’是跨任務跨場景的,最好的本體將萌生于中國?!?/p>

5月29日,在2025張江具身智能開發(fā)者大會“具身·無界:智能模型的范式創(chuàng)新與架構(gòu)革命”論壇期間,聯(lián)匯科技(OmAI)CEO兼首席科學家趙天成在接受澎湃新聞記者采訪時作出上述表述。

隨著具身智能浪潮的興起,為了讓機器人能真正理解物理世界,視覺語言模型(VLM)、視覺語言動作模型(VLA)等具身智能大模型應運而生。當前,如何讓具身智能像人類一樣進行規(guī)劃與操作,成為學術(shù)界與產(chǎn)業(yè)界共同面臨的挑戰(zhàn)。

趙天成畢業(yè)于卡耐基梅隆大學計算機系,在視覺語言模型領域有著多年的深入研究,多次擔任國際頂會領域主席,是國家重點研發(fā)計劃(青年科學家)項目負責人。其創(chuàng)辦的OmAILab人工智能實驗室在今年2月推出了VLM-R1開源視覺語言大模型,采用生成式獎勵處理優(yōu)化(Generative Reward Processing Optimization, GRPO)強化學習技術(shù),將DeepSeek R1的方法從純文本領域遷移到了視覺語言領域,目前在GitHub上已獲得近5000顆星。

“當前具身智能模型的發(fā)展狀態(tài),與2017年、2018年的大語言模型有相似之處,呈現(xiàn)出百花齊放的態(tài)勢,存在諸多技術(shù)路線。但方向較為明確,就是構(gòu)建‘世界模型’。”趙天成表示,目前全球各實驗室在實現(xiàn)世界模型方面均有各自不同的思路,“成熟的VLM模型,其理解與生成功能目前仍是分離的。我們正開展研究,探索如何實現(xiàn)統(tǒng)一結(jié)構(gòu)”。

對于VLM-R1的走紅,趙天成稱,最初發(fā)布的目的是讓模型能夠更好地進行復雜物體理解與視覺推理,目前社區(qū)已基于其開放框架衍生出眾多新應用。

“終端用戶真正需要的是一個能交付結(jié)果、完成任務的完整智能體(Agent)。我們團隊專注的是可以實際部署于物理終端的智能體,不論是機器狗、無人機還是攝像頭,都可以變成智能體?!壁w天成認為,智能終端面臨的挑戰(zhàn)比單模型層面要大得多,具身智能絕非僅憑一家公司之力便可做成,必然會存在生態(tài)分層的商業(yè)模式,“中國的制造業(yè)實力強勁,當下并非一兩家,而是有十幾上百家企業(yè)在從事硬件本體研發(fā)。我們專注于做好‘大腦’(AI能力)部分,與從事本體研發(fā)、打造‘小腦’(運動控制)的公司展開合作,這才是效率更高的商業(yè)模式,可以推動機器人真正進入良好的發(fā)展循環(huán)”。

趙天成強調(diào),中國在具身智能領域具備顯著優(yōu)勢,尤其是在供應鏈制造業(yè)和數(shù)據(jù)方面。他以小腦系統(tǒng)為例表示,“小腦和硬件的高度吻合意味著,在中國更有機會萌生出最好的本體,我認為這是具有較高確定性的事情”。

趙天成同時也向記者透露,其團隊近期將推出機器人大腦平臺,旨在通過與更多硬件廠商合作,使智能硬件超越單純硬件屬性,成為能結(jié)合應用場景的智能體。

據(jù)趙天成介紹,上述機器人大腦涵蓋語言交互、3D空間感知、記憶以及決策執(zhí)行控制四大板塊,能夠依據(jù)應用場景實現(xiàn)快速定義。

在當天的論壇上,趙天成便以移動機器人智能體為例,展示了其VLM在服務場景中融合多模態(tài)感知、長程記憶與自適應決策的完整閉環(huán)案例:機器狗結(jié)合地圖與視覺進行導航,尋找目的地并完成相應動作,隨后憑借記憶實現(xiàn)自主返航。

趙天成強調(diào),物理終端智能體與普通智能體存在一個顯著差異,就是必須要“快”,要確保響應的時效性,“不能出現(xiàn)我說一句話,機器人過了很久才行動的情況,這是任何人都無法接受的”。

他表示,可以通過強化學習,使更小的模型能夠解決特定場景的復雜任務,進而提高響應速度;也可借助模型結(jié)構(gòu)的改進,例如替代類似GPT的自回歸生成方式,采用一次性生成一套方案的方法,從本質(zhì)層面實現(xiàn)提速。“對于一些特別復雜的邏輯判斷,現(xiàn)在總體來說會慢一些,可能還需要一兩年時間去不斷進化”。趙天成預測道。

那么,具身智能的AGI(通用人工智能)何時能夠到來?趙天成認為,一定是通過海量的某種學習方式,使其涌現(xiàn)出智能,“真正的涌現(xiàn)應當是跨任務跨場景的,而不僅僅是抓取、疊衣服等初級能力”。

技術(shù)開源打破“單一陣營”的壁壘,機器人大腦平臺提供了從理論模型到物理終端的轉(zhuǎn)化工具,協(xié)同創(chuàng)新正加速推動具身智能技術(shù)的迭代發(fā)展。

    責任編輯:孫扶
    澎湃新聞報料:021-962866
    澎湃新聞,未經(jīng)授權(quán)不得轉(zhuǎn)載
    +1
    收藏
    我要舉報
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網(wǎng)安備31010602000299號

            互聯(lián)網(wǎng)新聞信息服務許可證:31120170006

            增值電信業(yè)務經(jīng)營許可證:滬B2-2017116

            ? 2014-2025 上海東方報業(yè)有限公司

            反饋
            主站蜘蛛池模板: 辽阳市| 东乡| 体育| 凯里市| 封开县| 通州市| 会理县| 怀仁县| 平舆县| 理塘县| 澎湖县| 孝义市| 横峰县| 平南县| 宣威市| 观塘区| 丰原市| 手游| 和平县| 澄江县| 年辖:市辖区| 元朗区| 仁寿县| 台江县| 高唐县| 南阳市| 开封县| 绥芬河市| 霍城县| 天柱县| 荣成市| 汾西县| 武安市| 娱乐| 儋州市| 牡丹江市| 横山县| 都匀市| 岳池县| 白山市| 道真|