下載客戶端

登錄

稚暉君的機器人“0元購”計劃

2024-08-19 12:44

來源：澎湃新聞·澎湃號·湃客

作者 | 山竹

出品 | 鋅產(chǎn)業(yè)（公眾號：xinchanye2021）

2023年8月18日，成立僅半年的智元機器人帶著第一代人形機器人遠征A1召開了第一場新品發(fā)布會。

僅僅半年時間，曾經(jīng)的華為天才少年、B站百大UP主稚暉君就拉起了一支龐大的研發(fā)團隊，設(shè)計出了復雜的產(chǎn)品規(guī)劃框架，拿出自己的第一代人形機器人。

在那場發(fā)布會上，稚暉君描繪了自己想象中的人形機器人：

他說，預訓練大語言模型龐大的先驗知識庫和復雜的多級推理能力，讓人形機器人有了向通用型發(fā)展的可能；

他說，人形機器人的關(guān)鍵是大腦，智元機器人將人形機器人大腦結(jié)構(gòu)設(shè)計為云端的超腦+端側(cè)的大腦、小腦和腦干；

他說，人形機器人的開發(fā)有賴于廣大開發(fā)者，智元機器人將推出開放平臺和低成本教育版硬件，供開發(fā)者二次開發(fā)；

他說，希望未來的人形機器人要進入產(chǎn)業(yè)，需要做到20萬元以內(nèi)；

……

一年之后，同樣是在國內(nèi)最大的機器人大會——WRC 2024召開前夕，稚暉君再次召開了他的人形機器人新品發(fā)布會。

稚暉君和他的愿景在這一年里實現(xiàn)了多少？

這次，稚暉君又將會帶來什么？

01 稚暉君的“0元購”小目標

在創(chuàng)業(yè)做人形機器人之前，稚暉君有兩個標簽，一個是華為天才少年，另一個是B站UP主，兩個身份都很極客。

而稚暉君這個名字火起來，也正是源于他在華為工作之余，在B站發(fā)布的各種超級硬核的機器人研發(fā)視頻后為眾人熟知，由此他還拿到了2021年B站百大UP主的稱號。

或是因為自己就是極客開發(fā)者，因而對開發(fā)者這個群體有著獨特的共情和認知，在創(chuàng)業(yè)智元、做人形機器人后的第一場發(fā)布會上，他就說，要開源。

開源，成了稚暉君的第一個小目標。

一年后，在今年的發(fā)布會上，稚暉君發(fā)布了兩款產(chǎn)品，實現(xiàn)了他的小目標。

第一款產(chǎn)品是，AIDEA系列軟件平臺。

智元研發(fā)的這套AIDEA軟件平臺包括功能部署平臺、數(shù)據(jù)平臺、機器學習平臺、仿真平臺，其中最為關(guān)鍵的是數(shù)據(jù)采集和數(shù)據(jù)處理。

實際上，這套軟件平臺過去幾個月里已經(jīng)在智元內(nèi)部應用，智元機器人不僅有AIDEA Sim仿真數(shù)據(jù)工廠，還在臨港區(qū)的機器人工廠中專門設(shè)立了AIDEA數(shù)采超級工廠。

在這些數(shù)據(jù)生產(chǎn)和采集工作進行過程中，隨著數(shù)據(jù)規(guī)模的不斷擴大，智元端到端具身大模型得到了不斷優(yōu)化，智元人形機器人在執(zhí)行分揀任務(wù)時，抓取成功率也逐漸得到了提升。

據(jù)稚暉君透露，智元AIDEA平臺將在今年Q4對外開源，屆時一并對外開源的還有擁有百萬條真機數(shù)據(jù)、千萬條仿真數(shù)據(jù)的數(shù)據(jù)集。

第二款產(chǎn)品是，數(shù)采本體，也就是人形機器人。

這場發(fā)布會上，稚暉君一共對外發(fā)布了五款人形機器人，包括用于交互服務(wù)場景的遠征A2、用于柔性制造場景的遠征A2-W、用于重載特種場景的遠征A2-MAX，以及模塊化機器人X1。

這其中最為獨特的是X1，作為稚暉君為這場發(fā)布會預留的one more thing，X1是今年6月新成立的智元X-Lab研發(fā)的第一款產(chǎn)品，這款產(chǎn)品僅由不到10人的團隊用時不到3個月研發(fā)而成。

X1一個獨特之處是，全身30多個自由度僅僅用了智元自研的兩個型號的關(guān)節(jié)（PowerFlow R-86和R-52），因而擁有相當高的標準化。

另外，X1用到力傳感器的是低于工業(yè)精度的六維力傳感器，配備的靈巧手是低成本的二指夾具，還可以將手機放到機器人中作為機器人大腦。

可以說，這是智元面向開發(fā)者打造的一款極簡人形機器人，也是稚暉君在去年發(fā)布會上提到的低成本教育版硬件。

智元面向機器人數(shù)據(jù)采集場景，除了有重量級采訓推理一體機器人A2-W，另一款輕量級人形機器人產(chǎn)品X1-W，就是由X1衍生而來。

據(jù)稚暉君透露，智元今年下半年將會投入百臺以上機器人做數(shù)據(jù)采集工作。

人工智能技術(shù)要想在某一領(lǐng)域成熟應用，海量數(shù)據(jù)必不可少。

回看人工智能技術(shù)應用最成熟的兩個領(lǐng)域，一個是自動駕駛，另一個是預訓練大語言模型，前者每天有數(shù)百萬真車Shadow數(shù)據(jù)，后者更是有海量的互聯(lián)網(wǎng)數(shù)據(jù)。

稚暉君說，具身智能領(lǐng)域“沒有免費的午餐”。

于是，他為大家提供了第一份免費的午餐。

據(jù)他在發(fā)布會上表示，智元將會開源X1除關(guān)節(jié)外所有本體的設(shè)計圖紙、軟件框架、中間件源碼、基礎(chǔ)運控算法。

這也是稚暉君在發(fā)布會上提出的“0元購”。

02 智元的具身智能分級思路

如果說開源是稚暉君的一個小目標的話，那么，具身智能就是他的終極目標。

稚暉君稱，人形機器人本體只是通用人工智能的基礎(chǔ)，具身大腦才是重中之重。

為此，稚暉君參考自動駕駛分級標準，做了具身智能成熟度等級劃分。

在這份具身智能成熟度等級劃分中，稚暉君共將具身智能分為五個等級：

G1，基礎(chǔ)自動化。

具體是傳統(tǒng)基于手工設(shè)計，配合機器視覺做自動化反饋，整體是編程式、軌跡化的技術(shù)路線，這一階段的機器人是為特定場景量身定制的。

這一階段設(shè)計出的機器人雖然可以解決一些特定問題，但無法在不同場景中做低成本的快速遷移，不具備泛化能力。

G2，通用原子技能。

針對大量不同場景作業(yè)任務(wù)需求，提煉出可以復用的原子能力，并以相對通用的方式來實現(xiàn)。

這一階段設(shè)計出的機器人可以在一定程度上實現(xiàn)某一類類似場景任務(wù)的快速遷移，配合任務(wù)編排大模型，使得其具備一定的泛化能力。

據(jù)悉，智元研發(fā)團隊參考強化學習準則已經(jīng)構(gòu)建了一套由自然語言驅(qū)動的、適配不同機器人硬件的Agent OS，這一項目在智元內(nèi)部雖然處于預研初期，但已經(jīng)在人形機器人上呈現(xiàn)出了一定任務(wù)編排能力。

例如，通過智元的Agent OS，遠征A2-W已經(jīng)可以完成一杯飲料制作的流程編排。

在通用原子模型方面，智元研發(fā)團隊已經(jīng)研發(fā)出通用位姿估計模型、通用抓取模型和通用力控插拔模型。

G3，端到端操作技能。

在技術(shù)架構(gòu)上與G2階段基本相同，不同的是，從手工設(shè)計各種原子化能力轉(zhuǎn)而通過數(shù)據(jù)采集，由數(shù)據(jù)驅(qū)動，端到端訓練出一些原子能力。

在這一階段，機器人學習一個新的技能將不再需要算法工程師手工設(shè)計，而是通過采集數(shù)據(jù)，基于數(shù)據(jù)進行模型訓練，配合認知推理規(guī)劃大模型，從而實現(xiàn)技能學習。

智元具身預研團隊也已經(jīng)在這方面開展技術(shù)研發(fā)工作。

實際上，智元研發(fā)團隊目前在具身智能領(lǐng)域進行技術(shù)研發(fā)時，是G2、G3兩條路線在并行推行。

G4，端到端操作大模型。

集合前三個階段優(yōu)點，構(gòu)建端到端通用操作大模型（LMM）。

在G3階段，對于「擰開瓶蓋」和「擰開門把手」兩個任務(wù)，人形機器人需要分別采集數(shù)據(jù)，通過數(shù)據(jù)進行模型訓練，得到兩個不同的技能。

但這兩個動作的底層邏輯都是用手“擰”一個物體，本質(zhì)上是一個動作。

在G4階段，通過引入大量跨場景仿真數(shù)據(jù)和真實數(shù)據(jù)，再引入世界模型，從而幫助AI模型理解這些動作背后的物理原理，進一步提升機器人在復雜任務(wù)中的表現(xiàn)，實現(xiàn)跨場景的泛化能力。

G5，AGI。

通過大語言模型、大操作模型的融合，提供足夠多的任務(wù)數(shù)據(jù)后，形成一個從感知、決策到執(zhí)行的端到端大模型。

彼時，具身智能將在開放場景具備跨任務(wù)的泛化能力。

這是稚暉君提出的具身智能分級標準，也是他為智元規(guī)劃的人形機器人發(fā)展路線。

要實現(xiàn)具身智能，不僅需要機器人硬件本體，還需要完整的軟件技術(shù)架構(gòu)，實際上，智元將人形機器人技術(shù)框架拆解為動力域、感知域、通信域和控制域四部分。

除去動力域的關(guān)節(jié)電機、感知域的傳感模塊、控制域的運控算法和具身算法外，智元研發(fā)團隊甚至摒棄了傳統(tǒng)的ROS框架，自研了一套名為AimRT的通信框架。

這套輕量級的通信架構(gòu)兼容ROS2生態(tài)模塊，也將在今年9月底正式開源。

03 如何成為賣“機器人鏟子”的人？

在由ChatGPT帶來的通用人工智能技術(shù)浪潮之下，人形機器人迎來了百年難遇的利好發(fā)展期。

就國內(nèi)人形機器人產(chǎn)業(yè)發(fā)展而言，北京、上海、深圳、寧波等地已經(jīng)先后成立人形機器人創(chuàng)新中心，他們就人形機器人產(chǎn)業(yè)發(fā)展相關(guān)的基礎(chǔ)設(shè)施——精密零部件、機器人母平臺、開源數(shù)據(jù)集進行了集中攻關(guān)。

以北京為例，北京不僅組建了全國首個人形機器人創(chuàng)新中心，還在亦莊、昌平建了兩個機器人產(chǎn)業(yè)園區(qū)，園區(qū)落地企業(yè)已有18家。

此外，北京具身智能專利池已完成654件專利入池，北京市去年設(shè)立的百億機器人產(chǎn)業(yè)基金，也已累計投出了12億元，支持了11個重點項目。

而就經(jīng)濟規(guī)模來看，2023年北京機器人產(chǎn)業(yè)總收入已經(jīng)超過200億元，企業(yè)數(shù)量超過400家，其中專精特新小巨人企業(yè)就有50家。

行業(yè)發(fā)展趨勢利好，企業(yè)發(fā)展勢頭正猛，但人形機器人作為科技界的世紀難題，依然無法在短期內(nèi)實現(xiàn)它的產(chǎn)業(yè)價值。

對此，鋅產(chǎn)業(yè)在上一篇文章中結(jié)合多位行業(yè)專家的觀點進行了詳細剖析，這里不再贅述。

那么，在這一個階段，能夠真正從市場中賺到錢的，就只有賣鏟子的人。

對于大部分人形機器人領(lǐng)域先行者而言，在這期間，他們需要做好兩件事：

一方面，要通過快速技術(shù)迭代，跑到行業(yè)前列。

只有成為頭部玩家，才能保證自己在大浪淘沙時可以“剩”者為王，也能夠在下一個產(chǎn)業(yè)寒冬期有足夠的底牌拿到融資。

智元這次下如此大功夫做開源，就是為了在人形機器人產(chǎn)業(yè)高速發(fā)展期再加一把推力，也是為了通過開源生態(tài)力量，建立自己的技術(shù)壁壘。

另一方面，要做好“產(chǎn)品”商業(yè)化。

既要做好人形機器人的“預”商業(yè)化，也要做好服務(wù)人形機器人產(chǎn)業(yè)“工具產(chǎn)品”的商業(yè)化。

目前仍然處于人形機器人產(chǎn)業(yè)導入的初級階段，智元的遠征A2和A2-W雖然開始籌備規(guī)模量產(chǎn)，遠征系列人形機器人也已經(jīng)在制造業(yè)場景中進行POC，預計今年能夠在制造業(yè)實現(xiàn)部署應用。

但現(xiàn)階段的制造業(yè)對于人形機器人更多是一個提前布局，雙方是技術(shù)和戰(zhàn)略合作關(guān)系，而非真正的產(chǎn)品供需關(guān)系。

?這個階段，人形機器人企業(yè)無法在采購層面拿到如已經(jīng)成熟應用的倉儲物流機器人那樣規(guī)模的商業(yè)訂單，做好服務(wù)人形機器人產(chǎn)業(yè)的工具——諸如遙操作機器人、機器人開發(fā)平臺，就成了一條不錯的商業(yè)化的路子。

從這次智元機器人的發(fā)布會來看，無論是推出的數(shù)據(jù)采集機器人，還是面向開發(fā)者的靈犀X1，都是當下人形機器人產(chǎn)業(yè)中扮演“鏟子”角色的產(chǎn)品。

這二者是這個時代的必然需求，也是跨越周期的一個中間商業(yè)地帶。

特別聲明

本文為澎湃號作者或機構(gòu)在澎湃新聞上傳并發(fā)布，僅代表該作者或機構(gòu)觀點，不代表澎湃新聞的觀點或立場，澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。

我要舉報

#稚暉君

掃碼下載澎湃新聞客戶端

澎湃矩陣

澎湃新聞微博
澎湃新聞公眾號
澎湃新聞抖音號
派生萬物開放平臺
IP SHANGHAI
SIXTH TONE

新聞報料

報料熱線: 021-962866
報料郵箱: news@thepaper.cn

滬ICP備14003370號

滬公網(wǎng)安備31010602000299號

互聯(lián)網(wǎng)新聞信息服務(wù)許可證：31120170006

增值電信業(yè)務(wù)經(jīng)營許可證：滬B2-2017116

? 2014-2025 上海東方報業(yè)有限公司

反饋

▓成人丝瓜视频▓无码免费,99精品国产一区二区三区不卡 ,大长腿白丝被c到爽哭视频 ,高清无码内谢

稚暉君的機器人“0元購”計劃

掃碼下載澎湃新聞客戶端