- +1
稚暉君的機器人“0元購”計劃

作者 | 山竹
出品 | 鋅產(chǎn)業(yè)(公眾號:xinchanye2021)
2023年8月18日,成立僅半年的智元機器人帶著第一代人形機器人遠征A1召開了第一場新品發(fā)布會。
僅僅半年時間,曾經(jīng)的華為天才少年、B站百大UP主稚暉君就拉起了一支龐大的研發(fā)團隊,設(shè)計出了復雜的產(chǎn)品規(guī)劃框架,拿出自己的第一代人形機器人。
在那場發(fā)布會上,稚暉君描繪了自己想象中的人形機器人:
他說,預訓練大語言模型龐大的先驗知識庫和復雜的多級推理能力,讓人形機器人有了向通用型發(fā)展的可能;
他說,人形機器人的關(guān)鍵是大腦,智元機器人將人形機器人大腦結(jié)構(gòu)設(shè)計為云端的超腦+端側(cè)的大腦、小腦和腦干;
他說,人形機器人的開發(fā)有賴于廣大開發(fā)者,智元機器人將推出開放平臺和低成本教育版硬件,供開發(fā)者二次開發(fā);
他說,希望未來的人形機器人要進入產(chǎn)業(yè),需要做到20萬元以內(nèi);
……
一年之后,同樣是在國內(nèi)最大的機器人大會——WRC 2024召開前夕,稚暉君再次召開了他的人形機器人新品發(fā)布會。
稚暉君和他的愿景在這一年里實現(xiàn)了多少?
這次,稚暉君又將會帶來什么?
01 稚暉君的“0元購”小目標
在創(chuàng)業(yè)做人形機器人之前,稚暉君有兩個標簽,一個是華為天才少年,另一個是B站UP主,兩個身份都很極客。
而稚暉君這個名字火起來,也正是源于他在華為工作之余,在B站發(fā)布的各種超級硬核的機器人研發(fā)視頻后為眾人熟知,由此他還拿到了2021年B站百大UP主的稱號。
或是因為自己就是極客開發(fā)者,因而對開發(fā)者這個群體有著獨特的共情和認知,在創(chuàng)業(yè)智元、做人形機器人后的第一場發(fā)布會上,他就說,要開源。

開源,成了稚暉君的第一個小目標。
一年后,在今年的發(fā)布會上,稚暉君發(fā)布了兩款產(chǎn)品,實現(xiàn)了他的小目標。
第一款產(chǎn)品是,AIDEA系列軟件平臺。
智元研發(fā)的這套AIDEA軟件平臺包括功能部署平臺、數(shù)據(jù)平臺、機器學習平臺、仿真平臺,其中最為關(guān)鍵的是數(shù)據(jù)采集和數(shù)據(jù)處理。

實際上,這套軟件平臺過去幾個月里已經(jīng)在智元內(nèi)部應用,智元機器人不僅有AIDEA Sim仿真數(shù)據(jù)工廠,還在臨港區(qū)的機器人工廠中專門設(shè)立了AIDEA數(shù)采超級工廠。

在這些數(shù)據(jù)生產(chǎn)和采集工作進行過程中,隨著數(shù)據(jù)規(guī)模的不斷擴大,智元端到端具身大模型得到了不斷優(yōu)化,智元人形機器人在執(zhí)行分揀任務(wù)時,抓取成功率也逐漸得到了提升。
據(jù)稚暉君透露,智元AIDEA平臺將在今年Q4對外開源,屆時一并對外開源的還有擁有百萬條真機數(shù)據(jù)、千萬條仿真數(shù)據(jù)的數(shù)據(jù)集。
第二款產(chǎn)品是,數(shù)采本體,也就是人形機器人。
這場發(fā)布會上,稚暉君一共對外發(fā)布了五款人形機器人,包括用于交互服務(wù)場景的遠征A2、用于柔性制造場景的遠征A2-W、用于重載特種場景的遠征A2-MAX,以及模塊化機器人X1。

這其中最為獨特的是X1,作為稚暉君為這場發(fā)布會預留的one more thing,X1是今年6月新成立的智元X-Lab研發(fā)的第一款產(chǎn)品,這款產(chǎn)品僅由不到10人的團隊用時不到3個月研發(fā)而成。
X1一個獨特之處是,全身30多個自由度僅僅用了智元自研的兩個型號的關(guān)節(jié)(PowerFlow R-86和R-52),因而擁有相當高的標準化。

另外,X1用到力傳感器的是低于工業(yè)精度的六維力傳感器,配備的靈巧手是低成本的二指夾具,還可以將手機放到機器人中作為機器人大腦。
可以說,這是智元面向開發(fā)者打造的一款極簡人形機器人,也是稚暉君在去年發(fā)布會上提到的低成本教育版硬件。
智元面向機器人數(shù)據(jù)采集場景,除了有重量級采訓推理一體機器人A2-W,另一款輕量級人形機器人產(chǎn)品X1-W,就是由X1衍生而來。

據(jù)稚暉君透露,智元今年下半年將會投入百臺以上機器人做數(shù)據(jù)采集工作。
人工智能技術(shù)要想在某一領(lǐng)域成熟應用,海量數(shù)據(jù)必不可少。
回看人工智能技術(shù)應用最成熟的兩個領(lǐng)域,一個是自動駕駛,另一個是預訓練大語言模型,前者每天有數(shù)百萬真車Shadow數(shù)據(jù),后者更是有海量的互聯(lián)網(wǎng)數(shù)據(jù)。
稚暉君說,具身智能領(lǐng)域“沒有免費的午餐”。
于是,他為大家提供了第一份免費的午餐。
據(jù)他在發(fā)布會上表示,智元將會開源X1除關(guān)節(jié)外所有本體的設(shè)計圖紙、軟件框架、中間件源碼、基礎(chǔ)運控算法。

這也是稚暉君在發(fā)布會上提出的“0元購”。
02 智元的具身智能分級思路
如果說開源是稚暉君的一個小目標的話,那么,具身智能就是他的終極目標。
稚暉君稱,人形機器人本體只是通用人工智能的基礎(chǔ),具身大腦才是重中之重。
為此,稚暉君參考自動駕駛分級標準,做了具身智能成熟度等級劃分。
在這份具身智能成熟度等級劃分中,稚暉君共將具身智能分為五個等級:

G1,基礎(chǔ)自動化。
具體是傳統(tǒng)基于手工設(shè)計,配合機器視覺做自動化反饋,整體是編程式、軌跡化的技術(shù)路線,這一階段的機器人是為特定場景量身定制的。
這一階段設(shè)計出的機器人雖然可以解決一些特定問題,但無法在不同場景中做低成本的快速遷移,不具備泛化能力。
G2,通用原子技能。
針對大量不同場景作業(yè)任務(wù)需求,提煉出可以復用的原子能力,并以相對通用的方式來實現(xiàn)。
這一階段設(shè)計出的機器人可以在一定程度上實現(xiàn)某一類類似場景任務(wù)的快速遷移,配合任務(wù)編排大模型,使得其具備一定的泛化能力。
據(jù)悉,智元研發(fā)團隊參考強化學習準則已經(jīng)構(gòu)建了一套由自然語言驅(qū)動的、適配不同機器人硬件的Agent OS,這一項目在智元內(nèi)部雖然處于預研初期,但已經(jīng)在人形機器人上呈現(xiàn)出了一定任務(wù)編排能力。

例如,通過智元的Agent OS,遠征A2-W已經(jīng)可以完成一杯飲料制作的流程編排。
在通用原子模型方面,智元研發(fā)團隊已經(jīng)研發(fā)出通用位姿估計模型、通用抓取模型和通用力控插拔模型。
G3,端到端操作技能。
在技術(shù)架構(gòu)上與G2階段基本相同,不同的是,從手工設(shè)計各種原子化能力轉(zhuǎn)而通過數(shù)據(jù)采集,由數(shù)據(jù)驅(qū)動,端到端訓練出一些原子能力。
在這一階段,機器人學習一個新的技能將不再需要算法工程師手工設(shè)計,而是通過采集數(shù)據(jù),基于數(shù)據(jù)進行模型訓練,配合認知推理規(guī)劃大模型,從而實現(xiàn)技能學習。
智元具身預研團隊也已經(jīng)在這方面開展技術(shù)研發(fā)工作。

實際上,智元研發(fā)團隊目前在具身智能領(lǐng)域進行技術(shù)研發(fā)時,是G2、G3兩條路線在并行推行。
G4,端到端操作大模型。
集合前三個階段優(yōu)點,構(gòu)建端到端通用操作大模型(LMM)。
在G3階段,對于「擰開瓶蓋」和「擰開門把手」兩個任務(wù),人形機器人需要分別采集數(shù)據(jù),通過數(shù)據(jù)進行模型訓練,得到兩個不同的技能。
但這兩個動作的底層邏輯都是用手“擰”一個物體,本質(zhì)上是一個動作。
在G4階段,通過引入大量跨場景仿真數(shù)據(jù)和真實數(shù)據(jù),再引入世界模型,從而幫助AI模型理解這些動作背后的物理原理,進一步提升機器人在復雜任務(wù)中的表現(xiàn),實現(xiàn)跨場景的泛化能力。

G5,AGI。
通過大語言模型、大操作模型的融合,提供足夠多的任務(wù)數(shù)據(jù)后,形成一個從感知、決策到執(zhí)行的端到端大模型。
彼時,具身智能將在開放場景具備跨任務(wù)的泛化能力。
這是稚暉君提出的具身智能分級標準,也是他為智元規(guī)劃的人形機器人發(fā)展路線。
要實現(xiàn)具身智能,不僅需要機器人硬件本體,還需要完整的軟件技術(shù)架構(gòu),實際上,智元將人形機器人技術(shù)框架拆解為動力域、感知域、通信域和控制域四部分。
除去動力域的關(guān)節(jié)電機、感知域的傳感模塊、控制域的運控算法和具身算法外,智元研發(fā)團隊甚至摒棄了傳統(tǒng)的ROS框架,自研了一套名為AimRT的通信框架。

這套輕量級的通信架構(gòu)兼容ROS2生態(tài)模塊,也將在今年9月底正式開源。
03 如何成為賣“機器人鏟子”的人?
在由ChatGPT帶來的通用人工智能技術(shù)浪潮之下,人形機器人迎來了百年難遇的利好發(fā)展期。
就國內(nèi)人形機器人產(chǎn)業(yè)發(fā)展而言,北京、上海、深圳、寧波等地已經(jīng)先后成立人形機器人創(chuàng)新中心,他們就人形機器人產(chǎn)業(yè)發(fā)展相關(guān)的基礎(chǔ)設(shè)施——精密零部件、機器人母平臺、開源數(shù)據(jù)集進行了集中攻關(guān)。
以北京為例,北京不僅組建了全國首個人形機器人創(chuàng)新中心,還在亦莊、昌平建了兩個機器人產(chǎn)業(yè)園區(qū),園區(qū)落地企業(yè)已有18家。
此外,北京具身智能專利池已完成654件專利入池,北京市去年設(shè)立的百億機器人產(chǎn)業(yè)基金,也已累計投出了12億元,支持了11個重點項目。
而就經(jīng)濟規(guī)模來看,2023年北京機器人產(chǎn)業(yè)總收入已經(jīng)超過200億元,企業(yè)數(shù)量超過400家,其中專精特新小巨人企業(yè)就有50家。
行業(yè)發(fā)展趨勢利好,企業(yè)發(fā)展勢頭正猛,但人形機器人作為科技界的世紀難題,依然無法在短期內(nèi)實現(xiàn)它的產(chǎn)業(yè)價值。
對此,鋅產(chǎn)業(yè)在上一篇文章中結(jié)合多位行業(yè)專家的觀點進行了詳細剖析,這里不再贅述。
那么,在這一個階段,能夠真正從市場中賺到錢的,就只有賣鏟子的人。
對于大部分人形機器人領(lǐng)域先行者而言,在這期間,他們需要做好兩件事:
一方面,要通過快速技術(shù)迭代,跑到行業(yè)前列。
只有成為頭部玩家,才能保證自己在大浪淘沙時可以“剩”者為王,也能夠在下一個產(chǎn)業(yè)寒冬期有足夠的底牌拿到融資。
智元這次下如此大功夫做開源,就是為了在人形機器人產(chǎn)業(yè)高速發(fā)展期再加一把推力,也是為了通過開源生態(tài)力量,建立自己的技術(shù)壁壘。
另一方面,要做好“產(chǎn)品”商業(yè)化。
既要做好人形機器人的“預”商業(yè)化,也要做好服務(wù)人形機器人產(chǎn)業(yè)“工具產(chǎn)品”的商業(yè)化。
目前仍然處于人形機器人產(chǎn)業(yè)導入的初級階段,智元的遠征A2和A2-W雖然開始籌備規(guī)模量產(chǎn),遠征系列人形機器人也已經(jīng)在制造業(yè)場景中進行POC,預計今年能夠在制造業(yè)實現(xiàn)部署應用。
但現(xiàn)階段的制造業(yè)對于人形機器人更多是一個提前布局,雙方是技術(shù)和戰(zhàn)略合作關(guān)系,而非真正的產(chǎn)品供需關(guān)系。
?這個階段,人形機器人企業(yè)無法在采購層面拿到如已經(jīng)成熟應用的倉儲物流機器人那樣規(guī)模的商業(yè)訂單,做好服務(wù)人形機器人產(chǎn)業(yè)的工具——諸如遙操作機器人、機器人開發(fā)平臺,就成了一條不錯的商業(yè)化的路子。
從這次智元機器人的發(fā)布會來看,無論是推出的數(shù)據(jù)采集機器人,還是面向開發(fā)者的靈犀X1,都是當下人形機器人產(chǎn)業(yè)中扮演“鏟子”角色的產(chǎn)品。
這二者是這個時代的必然需求,也是跨越周期的一個中間商業(yè)地帶。
本文為澎湃號作者或機構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機構(gòu)觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2025 上海東方報業(yè)有限公司