域名預(yù)訂/競(jìng)價(jià),好“米”不錯(cuò)過(guò)
8月21日,2024年世界機(jī)器人大會(huì)在北京正式開(kāi)幕,與以往最大的不同在于,今年是人形機(jī)器人參展企業(yè)最多的一屆 ,共有27家人形機(jī)器人整機(jī)企業(yè)、30多家產(chǎn)業(yè)鏈上下游企業(yè)亮相。
隨著AI突飛猛進(jìn),具身智能成為了今年資本市場(chǎng)上最熱的領(lǐng)域之一,那些曾經(jīng)僅存在于科幻電影中的機(jī)器人,正離現(xiàn)實(shí)生活越來(lái)越近,變得“看得見(jiàn)、摸得著”。
在開(kāi)幕前后,也有多家機(jī)器人公司發(fā)布了新產(chǎn)品,比如經(jīng)緯創(chuàng)投投資的宇樹(shù)科技發(fā)布了G1量產(chǎn)版本,起售價(jià)為9.9萬(wàn)元,這款產(chǎn)品在世界機(jī)器人大會(huì)上首次展出,更強(qiáng)性能、終極外觀,最關(guān)鍵的是可以大批量生產(chǎn)了。
宇樹(shù)G1機(jī)器人身手敏捷,不僅可以空中劈腿,還可以自由地上下樓梯,輕巧敏捷
英偉達(dá)科學(xué)家Erwin Coumans迫不及待想搞一臺(tái)來(lái)做實(shí)驗(yàn)
智元機(jī)器人則是一口氣發(fā)布了五款商用人形機(jī)器人產(chǎn)品,包括3款適用于不同場(chǎng)景的遠(yuǎn)征系列(A2、A2-W、A2-Max),2款模塊化機(jī)器人系列產(chǎn)品(靈犀X1和X1-W,后者面向?qū)I(yè)數(shù)據(jù)采集)。
星塵智能則發(fā)布了新一代AI機(jī)器人助理Astribot S1,這款產(chǎn)品也在2024世界機(jī)器人大會(huì)上正式亮相。
星塵智能的機(jī)器人助理Astribot S1,正在烘烤華夫餅
今天隨著人形機(jī)器人越來(lái)越走進(jìn)現(xiàn)實(shí),也迎來(lái)了群雄逐鹿的時(shí)刻,但技術(shù)路線仍不確定、應(yīng)用場(chǎng)景皆有可能。 經(jīng)緯創(chuàng)投在幾年前就系統(tǒng)性地關(guān)注通用智能機(jī)器人賽道,在機(jī)器人軟硬件一體化領(lǐng)域,投資了宇樹(shù)科技、智元機(jī)器人、銀河通用、星塵智能 ,它們都是優(yōu)秀的全技術(shù)棧型創(chuàng)業(yè)公司,但各自的技術(shù)切入方向并不相同,切入的應(yīng)用場(chǎng)景也不盡相同,有工業(yè)、倉(cāng)儲(chǔ)物流、零售、生物制藥等等場(chǎng)景。短期目標(biāo)都是快速占領(lǐng)各自的應(yīng)用場(chǎng)景,誰(shuí)先把一個(gè)細(xì)分場(chǎng)景做好,積累出足夠多的數(shù)據(jù),就有可能繼續(xù)拓展新的延展領(lǐng)域,最終走向通用化。
除了機(jī)器人軟硬件一體化外,在產(chǎn)業(yè)鏈上游的兩個(gè)重要方向(數(shù)據(jù)、一體化關(guān)節(jié)) ,經(jīng)緯創(chuàng)投也投資了AI仿真數(shù)據(jù)領(lǐng)域的光輪智能 ,正在為行業(yè)提供海量的高真實(shí)性、高效用性的訓(xùn)練數(shù)據(jù);而在一體化關(guān)節(jié)/執(zhí)行器領(lǐng)域,經(jīng)緯則投資了鈦虎機(jī)器人 ,鈦虎有非常高效和全面的產(chǎn)品系列,覆蓋了從靈巧手到全身上下的所有關(guān)節(jié)……
相比于AI大模型,人形機(jī)器人更需要工程層面的實(shí)踐與突破。 比如1990 年出生的王興興,并不是履歷亮眼的學(xué)霸型創(chuàng)業(yè)者,他是一個(gè)典型的理科偏才。“大家可能覺(jué)得很多頂尖院校的人很厲害,但實(shí)際上大家都是普通人,在機(jī)器人這個(gè)行業(yè)里,很多人只做軟件,完全沒(méi)碰過(guò)硬件,而硬件是實(shí)踐出來(lái)的,你知道就是知道,不知道就是不知道。” 宇樹(shù)科技創(chuàng)始人兼CEO王興興說(shuō),在大學(xué)時(shí)代他就發(fā)現(xiàn),只要集合最好的零部件,并且用上最先進(jìn)的軟件,就可以做出一個(gè)更好產(chǎn)品,組合式創(chuàng)新。
與王興興有著類似的經(jīng)歷,鈦虎創(chuàng)始人易港是一位95后,早在大學(xué)宿舍就搞起了3D打印機(jī)和焊臺(tái),大一就做出了假肢原型機(jī),還在中美創(chuàng)客大賽中獲獎(jiǎng);大二又做出了一套主從式外骨骼,手部擁有17個(gè)自由度。他總結(jié)自己為什么能在大學(xué)時(shí)期的很多獎(jiǎng)項(xiàng)中,打敗名校的參賽項(xiàng)目,最核心的就是自己的產(chǎn)品“看得到、摸得著、能體驗(yàn),對(duì)社會(huì)有直接價(jià)值,而不是漂亮的PPT。”
隨著AI大模型的突破,今天的人形機(jī)器人,正越來(lái)越逼近臨界點(diǎn)。 有越來(lái)越多之前不敢想的任務(wù),如今都可以實(shí)現(xiàn)了。特別是隨著“世界模型”的提出,機(jī)器人的真機(jī)數(shù)據(jù)越來(lái)越具備實(shí)用價(jià)值。
“下一個(gè)十年,最值得做的就是人形機(jī)器人。” 星塵智能創(chuàng)始人來(lái)杰說(shuō),他曾是騰訊RoboticsX機(jī)器人實(shí)驗(yàn)室的一號(hào)員工、百度“小度機(jī)器人”團(tuán)隊(duì)負(fù)責(zé)人,在去年底離職創(chuàng)業(yè)。
“人工智能的黎明已經(jīng)迅速臨近,我預(yù)計(jì)在明年年底之前,全球至少會(huì)有一家公司能夠推出相對(duì)通用的機(jī)器人AI模型 ,發(fā)展速度之快令人矚目。” 王興興說(shuō),“我在年初提出了這一觀點(diǎn),至今仍然堅(jiān)信,明年年底實(shí)現(xiàn)這一目標(biāo)是非常有可能的。”
一、“軟與硬”的結(jié)合
不同技術(shù)路線、不同應(yīng)用場(chǎng)景,逐鹿方始
今天的機(jī)器人與以往最大的區(qū)別在于,隨著AI的爆發(fā),智能泛化能力大幅加強(qiáng),這讓通用機(jī)器人成為可能。 傳統(tǒng)機(jī)器人并不需要對(duì)外界自主響應(yīng),所以這是一個(gè)自動(dòng)化設(shè)備,不斷地重復(fù)之前預(yù)設(shè)的程序。而現(xiàn)在有了智能泛化能力的突破,甚至只需要語(yǔ)音控制,機(jī)器人就能實(shí)現(xiàn)新功能,這是從自動(dòng)化到智能化的底層轉(zhuǎn)變。
而AI大模型的能力,不僅體現(xiàn)在規(guī)劃層面,也開(kāi)始進(jìn)入感知和控制環(huán)節(jié),機(jī)器人發(fā)展了50多年,第一次出現(xiàn)這樣由學(xué)習(xí)算法驅(qū)動(dòng)、以及一個(gè)非常大的預(yù)訓(xùn)練模型來(lái)推動(dòng)控制環(huán)節(jié)的變化,這也是過(guò)去一年里,我們看到技術(shù)層面最大的突破。
“最終我們會(huì)有大腦大模型、小腦大模型,一起把本體串起來(lái),構(gòu)成一個(gè)通用機(jī)器人系統(tǒng)。” 北大-銀河通用具身智能聯(lián)合實(shí)驗(yàn)室主任王鶴說(shuō)。他認(rèn)為,通用機(jī)器人應(yīng)該由基石層和能力層支撐,在基石層最關(guān)鍵的是去打造一個(gè)通用的本體,數(shù)據(jù)依賴于本體,本體也決定了它能產(chǎn)生什么樣的數(shù)據(jù),兩者相互綁定?;诒倔w和數(shù)據(jù),進(jìn)而發(fā)展出機(jī)器人能力,主要是“大腦”和“小腦”,前者主要解決感知和決策問(wèn)題,后者把大腦的感知和決策轉(zhuǎn)換成動(dòng)作。
比如智元機(jī)器人也遵循了這樣的思考邏輯。“稚暉君”彭志輝從華為離職創(chuàng)業(yè)后,與上海交通大學(xué)博士生導(dǎo)師閆維新,組建了創(chuàng)始團(tuán)隊(duì),其中閆維新負(fù)責(zé)人形機(jī)器人的“身體”,彭志輝負(fù)責(zé)人形機(jī)器人的“大腦”。“過(guò)去,他們?cè)诠ぷ髦杏幸恍┙患瑒?chuàng)始人(彭志輝)提出這個(gè)想法之后,大家一拍即合。”
遠(yuǎn)征A1,是智元機(jī)器人的第一代產(chǎn)品,已于去年8月亮相。其步行速度為7公里/小時(shí),依靠視覺(jué)傳感器和多線激光雷達(dá)可自主避障。它的靈巧手有5根手指,能像人類一樣抓取物品。應(yīng)用場(chǎng)景專注于工廠、生物實(shí)驗(yàn)室、家庭護(hù)理與陪伴等。
而一年之后,8月18日上午,智元機(jī)器人一口氣發(fā)布了“遠(yuǎn)征”與“靈犀”兩大家族共計(jì)五款商用人形機(jī)器人新品:交互服務(wù)機(jī)器人遠(yuǎn)征A2、柔性智造機(jī)器人遠(yuǎn)征A2-W、重載特種機(jī)器人遠(yuǎn)征A2-Max、智元X-Lab孵化的首個(gè)全棧開(kāi)源機(jī)器人靈犀X1、專業(yè)數(shù)采機(jī)器人靈犀X1-W。
智元在發(fā)布會(huì)現(xiàn)場(chǎng),搭建了一個(gè)攝影棚,機(jī)器人當(dāng)場(chǎng)秀了一次在語(yǔ)音指令下,動(dòng)手調(diào)飲料的操作
對(duì)于機(jī)器人這樣,離不開(kāi)硬件做最終執(zhí)行的賽道,“軟硬一體”的能力尤其重要,像宇樹(shù)科技、智元、銀河通用、星塵等等公司都非常重視這一思路。 如果我們看電動(dòng)車(chē)與自動(dòng)駕駛行業(yè)的歷史,2015年第一批電動(dòng)車(chē)創(chuàng)業(yè)公司創(chuàng)立至今,在這個(gè)過(guò)程中,自動(dòng)駕駛創(chuàng)業(yè)公司的數(shù)量,并不少于電動(dòng)車(chē)創(chuàng)業(yè)公司。但在今天,單純做自動(dòng)駕駛的創(chuàng)業(yè)公司基本上都處于掙扎狀態(tài),鮮有獲得業(yè)務(wù)突破,哪怕曾經(jīng)獲得過(guò)巨額融資。
但從電動(dòng)車(chē)企的角度,不僅“蔚小理”等一眾新興電動(dòng)車(chē)企崛起,先有了“硬件”、產(chǎn)生數(shù)據(jù)閉環(huán),再切入自動(dòng)駕駛,反而有很大的業(yè)務(wù)進(jìn)展,各家的城市NOA越來(lái)越智能。如果一個(gè)行業(yè)離不開(kāi)硬件支撐,并且這個(gè)硬件仍處于快速迭代期,單純做這行業(yè)的軟件是要冒極大風(fēng)險(xiǎn)的。
類似于新能源汽車(chē)核心的三電系統(tǒng),彭志輝將機(jī)器人的核心系統(tǒng)分為:動(dòng)力域(電機(jī)關(guān)節(jié)、伺服控制、電源管理)、感知域(傳感器模塊、感知算法)、通信域(網(wǎng)絡(luò)接口、數(shù)據(jù)傳輸協(xié)議、中間件框架)、控制域(通用算力、AI算力單元、運(yùn)控算法、具身算法)。
“整個(gè)機(jī)器人其實(shí)是一個(gè)軟硬件極其復(fù)雜的系統(tǒng),既涉及到內(nèi)部各個(gè)硬件模塊的協(xié)同和部署,同時(shí)也需要軟件跟算法高效配合。” 彭志輝說(shuō)。
另一方面,雖然最終的目標(biāo)是通用化,但在當(dāng)下早期的發(fā)展階段,機(jī)器人的產(chǎn)品定義并不明確。 由于勞動(dòng)力和任務(wù)需求是多元的,人形機(jī)器人公司短期內(nèi)也不會(huì)只有唯一的巨頭,將會(huì)有很多公司圍繞不同細(xì)分市場(chǎng),走不同的技術(shù)方向,積累該場(chǎng)景下的數(shù)據(jù)護(hù)城河,這種“條條大路通羅馬”的局面會(huì)維持一段時(shí)間。
一些公司選擇把主要精力放在機(jī)器人的“上半身”。 比如銀河通用選擇的落地場(chǎng)景是無(wú)人值守藥店(特別是夜班),其首代產(chǎn)品蓋博特機(jī)器人,“下半身”就采取了輪式底盤(pán)+折疊本體的設(shè)計(jì)。之所以采取這樣的設(shè)計(jì),首先因?yàn)檩喪降妆P(pán)在零售場(chǎng)景里,已經(jīng)完全可以覆蓋絕大部分應(yīng)用。而折疊的設(shè)計(jì),往上可以摸到2.4米,可以覆蓋最高的貨架,機(jī)器人可以拿到所有貨物。
往下也可以摸到地面,比如當(dāng)有產(chǎn)品不小心掉到地面上時(shí),機(jī)器人也可以自己撿起來(lái)。這些都是目前機(jī)器人的雙腿結(jié)構(gòu),比較難解決的問(wèn)題,而在當(dāng)下集中精力先研發(fā)“手”,可能能夠率先實(shí)現(xiàn)應(yīng)用價(jià)值。
星塵智能創(chuàng)始人來(lái)杰則將自己的機(jī)器人產(chǎn)品定義為“助理” ,輔助人,而非替代人。首要的場(chǎng)景就是那些腦力勞動(dòng)更多,但卻經(jīng)常陷入一些重復(fù)操作的事情上。最典型的例子就是生物醫(yī)療和化學(xué)實(shí)驗(yàn),這些都是需要高智力勞動(dòng),但卻繞不開(kāi)重復(fù)操作的領(lǐng)域。此時(shí)一個(gè)合格的機(jī)器人助理,可以解放這些教授、博士們雙手,他們只需要設(shè)計(jì)實(shí)驗(yàn),而所有操作都可以讓機(jī)器人準(zhǔn)確無(wú)誤、不分晝夜的去完成。如果給一位生物教授配10個(gè)機(jī)器人助理,他用于創(chuàng)造的時(shí)間甚至可以翻幾倍。
來(lái)杰也非常重視“軟硬一體”的能力。 得益于在騰訊RoboticsX機(jī)器人實(shí)驗(yàn)室的經(jīng)歷,他非常重視架構(gòu),“我們與騰訊RoboticsX機(jī)器人實(shí)驗(yàn)室的架構(gòu)就很相似,一半主攻機(jī)器人軟硬件一體化,另一半強(qiáng)調(diào)用AI算法去做感知和運(yùn)動(dòng)控制,以此來(lái)探索AI和機(jī)器人的強(qiáng)耦合。”
星塵融合了觸覺(jué)感知進(jìn)行力控抓取,并結(jié)合規(guī)模化數(shù)據(jù)綜合訓(xùn)練 ,包括人體動(dòng)作視頻演示、動(dòng)捕、遙操作采集等方案。來(lái)杰非常重視傳動(dòng)結(jié)構(gòu)中的剛、柔結(jié)合 ,也裝入了一些傳感器以在傳動(dòng)過(guò)程中,能一直監(jiān)測(cè)力的傳輸。比如機(jī)器人在削黃瓜時(shí),星塵的機(jī)器人并不是去估算軌跡,而是與人類一樣,通過(guò)感知削皮刀在壓到黃瓜上時(shí),力量的大小,來(lái)控制力量的輸出,這種特殊的傳動(dòng)結(jié)構(gòu),能使精度更上一層樓。
“當(dāng)下,離我們想要的具身智能之間,還有兩個(gè)重要的Gap(差距)沒(méi)有解決。”星塵智能創(chuàng)始人來(lái)杰說(shuō)。
第一個(gè)Gap是AI大模型和機(jī)器人之間 ,有時(shí)候一些問(wèn)題的產(chǎn)生,并不是單純靠擴(kuò)大數(shù)據(jù)規(guī)模,或是算法就可以解決,而是需要在機(jī)器人層面去進(jìn)行提升,這是硬件帶來(lái)的。
第二個(gè)Gap是在硬件本身的表達(dá)能力足夠的前提下,AI如何更好地結(jié)合硬件的能力。 比如說(shuō)AI是否可能完全自主地進(jìn)行學(xué)習(xí)和嘗試?假設(shè)有一個(gè)機(jī)器人在辦公環(huán)境下,它本來(lái)什么都不知道,只知道一些基礎(chǔ)動(dòng)作,然后讓它自己去建語(yǔ)義地圖,自己去理解環(huán)境,自己去觀察其他人的操作,然后把所有動(dòng)作學(xué)會(huì),這就跟我們?nèi)祟惡芟?。?dāng)然,這也是Yann LeCun所提出的“世界模型”。
彭志輝在最近的發(fā)布會(huì)上,對(duì)整個(gè)具身技術(shù)成熟度等級(jí),做了從G1-G5的劃分,這類似于自動(dòng)駕駛的L1-L5:
“我們?cè)谶^(guò)去一年里,同時(shí)在G2落地和G3預(yù)研兩個(gè)方向,都取得了一些階段性突破。在G2階段實(shí)現(xiàn)了一系列zero-shot和few-shot的一些通用原子能力,比如通用的位姿估計(jì)模型UniPose。目前也正在與多家制造業(yè)和服務(wù)業(yè)領(lǐng)軍企業(yè),進(jìn)行聯(lián)合的場(chǎng)景POC,今年晚些時(shí)候有望全流程跑通,讓機(jī)器人能夠正式在客戶場(chǎng)景中部署干活。” 彭志輝說(shuō)。
二、“大部分人對(duì)社會(huì)的成本結(jié)構(gòu)一無(wú)所知”
硬件與中國(guó)供應(yīng)鏈
低成本是人形機(jī)器人大規(guī)模運(yùn)用的前提。 今年5月,宇樹(shù)在發(fā)布G1人形機(jī)器人時(shí),把最低售價(jià)打到了9.9萬(wàn)元。但這款機(jī)器人的參數(shù)一個(gè)不差,身高約127厘米,體重約35公斤,具有超越常人的靈活性,小跑速度大于2m/s,擁有廣闊的關(guān)節(jié)運(yùn)動(dòng)空間,23至43個(gè)關(guān)節(jié),最大關(guān)節(jié)扭矩達(dá)到120N.m,可進(jìn)行高難度的動(dòng)態(tài)動(dòng)作。比行業(yè)整體便宜80%的售價(jià),再一次成為人形機(jī)器人領(lǐng)域的焦點(diǎn)。
“大部分人對(duì)社會(huì)的成本結(jié)構(gòu)一無(wú)所知。” 王興興說(shuō),“低成本的原因其實(shí)很簡(jiǎn)單,以前很多學(xué)術(shù)或公司主要靠去買(mǎi)工業(yè)電機(jī),但它們很大、很貴、很重,所以做出來(lái)的效果也不太好。但我后來(lái)發(fā)現(xiàn),其實(shí)可以對(duì)航模電機(jī)加以改造,所以后來(lái)的電機(jī)驅(qū)動(dòng)器全是我自己做的,可以做到很小很便宜,再結(jié)合最新的運(yùn)動(dòng)控制技術(shù),就可以把整體性能做得非常好。其實(shí)整個(gè)社會(huì)大部分創(chuàng)新,是組合式創(chuàng)新,我們需要把各個(gè)行業(yè)的一些想法、技術(shù)組合做新的實(shí)踐,保證它是最前沿的,其實(shí)你就可以實(shí)現(xiàn)很多目標(biāo)。”
G1采用3指力控靈巧手,通過(guò)力位混合控制,能模擬人手的各種精準(zhǔn)操作
在2013年-2015年讀研究生期間,王興興沒(méi)什么資源和資金,卻做出了一款當(dāng)時(shí)特別火爆的產(chǎn)品XDog,拿到上海機(jī)器人設(shè)計(jì)大賽二等獎(jiǎng),這幾乎是他一個(gè)人從頭設(shè)計(jì)硬件、控制算法,自制驅(qū)動(dòng)電機(jī)做出來(lái)的。相比之下波士頓動(dòng)力的四足機(jī)器人,還是純液壓方案,雖然性能不錯(cuò),但是很大、很貴、很重,那時(shí)候純電機(jī)驅(qū)動(dòng)方案還是比較領(lǐng)先的。
“在制造成本方面,我甚至認(rèn)為機(jī)器人其實(shí)與家里的電風(fēng)扇本質(zhì)是一樣的,都可以通過(guò)各種方法將成本做到極致。”王興興說(shuō),他認(rèn)為大部分產(chǎn)品都可以分為“材料成本+加工成本”,如果能優(yōu)化整個(gè)流程,找到合適的加工方法,其實(shí)可以省很多錢(qián)。
與王興興讀研期間做了XDog類似,鈦虎創(chuàng)始人易港也在大學(xué)時(shí)期,東拼西湊了4-5萬(wàn)元,在大學(xué)宿舍里買(mǎi)了3D打印機(jī)和焊臺(tái),自學(xué)3D建模和編程,模仿德國(guó)骨科隱形冠軍企業(yè)奧托博克的產(chǎn)品,制作出了一款假肢原型機(jī),并在中美創(chuàng)客大賽中獲獎(jiǎng)。
“做機(jī)器人,充滿了工程方面的問(wèn)題,很多時(shí)候不是憑智商,而是看你對(duì)這個(gè)東西是不是真的感興趣,能不能去一點(diǎn)點(diǎn)鉆研,嘗試各種各樣的方法去解決技術(shù)難題,而且還要在一定的量產(chǎn)與成本可控的條件下。”易港說(shuō)。如今,鈦虎主攻高性能一體化關(guān)節(jié)/執(zhí)行器,延展到輕量級(jí)協(xié)作機(jī)械臂、人形機(jī)器人/外骨骼、靈巧手等,其產(chǎn)品主打高扭矩密度、體積小、重量輕,具備無(wú)框電機(jī)、減速器、驅(qū)動(dòng)器、編碼器自研設(shè)計(jì)能力,擁有機(jī)器人所需要的所有關(guān)節(jié),可以說(shuō)是最為全面的產(chǎn)品線。
如果從更全局的角度來(lái)看,人形機(jī)器人最核心的是軟件+執(zhí)行器,軟件負(fù)責(zé)感知和決策,本質(zhì)上與自動(dòng)駕駛類似,都需要先感知環(huán)境,然后做路徑規(guī)劃和決策。 而在硬件層面,也就是機(jī)械設(shè)計(jì)層面,最關(guān)鍵的就是執(zhí)行器,它相當(dāng)于機(jī)器人的“關(guān)節(jié)和肌肉”,讓機(jī)器人可以做出各種動(dòng)作,尤其是人形機(jī)器人,它的執(zhí)行器數(shù)量要遠(yuǎn)遠(yuǎn)高于傳統(tǒng)工業(yè)機(jī)器人,也是人形機(jī)器人的設(shè)計(jì)難點(diǎn)和重要成本項(xiàng)。
如果我們按功能拆解特斯拉Optimus Gen2的BoM成本,按Morgan Stanley的分析
“按分部”與“按功能”劃分BoM成本
如果只看機(jī)器人的硬件成本,其中占比最大的就是一體化關(guān)節(jié), 它集成了伺服電機(jī)、驅(qū)動(dòng)器、減速器和一些控制模塊等。在傳統(tǒng)工業(yè)機(jī)器人中,這些伺服電機(jī)、驅(qū)動(dòng)器、減速器等部件并不需要太集成,它們可以在空間上各自分立,通過(guò)各種線纜和連接件進(jìn)行連接,體積重量大。但人形機(jī)器人不可能這么做,而一體化關(guān)節(jié)/執(zhí)行器的定位,就是在設(shè)計(jì)層面,將它們集成為一體化,實(shí)現(xiàn)更小體積、更輕重量、更強(qiáng)扭矩性能。
鈦虎的關(guān)節(jié)產(chǎn)品
人形機(jī)器人還有一個(gè)特殊的核心零部件——靈巧手。 它高度仿人手,是人形機(jī)器人執(zhí)行動(dòng)作的最終零件,十分重要且復(fù)雜,面臨的最大難題是要在極小的空間內(nèi),驅(qū)動(dòng)自由度極多、配備功率密度高、控制精度高的電機(jī),對(duì)其性能要求極高。
比如特斯拉Optimus機(jī)器人,和人手一樣同樣使用5個(gè)手指,擁有11個(gè)自由度,拇指采用雙電機(jī)驅(qū)動(dòng)彎曲和側(cè)擺,其它四指各用一個(gè)電機(jī)帶動(dòng)。電機(jī)采用蝸桿傳動(dòng)機(jī)構(gòu)的目的,與腿部直線伺服如出一轍,采用機(jī)構(gòu)自鎖降低能耗。為追求形態(tài)美觀及自適應(yīng)性,手指采用拉線的傳動(dòng)機(jī)構(gòu),擁有負(fù)重20磅(9KG),和自適應(yīng)抓?。軌蜃ト〔煌螤睢⒊叽绲奈矬w)的能力,可完成搬運(yùn)、澆花等動(dòng)作。這基本上就復(fù)制了人類手掌的功能設(shè)計(jì)。
4年前,易港還自主研發(fā)了一款靈巧手,“我也沒(méi)想到這款產(chǎn)品在今天那么受歡迎,如今回頭看,其實(shí)這是現(xiàn)在三大主流結(jié)構(gòu)中的一個(gè),我們當(dāng)時(shí)為了做假肢,結(jié)果相當(dāng)于開(kāi)創(chuàng)了一個(gè)結(jié)構(gòu)派系。”
在靈巧手的傳動(dòng)結(jié)構(gòu)中,有奧托博克式的直線推桿方案,這個(gè)方案在2008年就實(shí)現(xiàn)了量產(chǎn)。另一種主流結(jié)構(gòu)是拉繩式,類似于模仿人體的筋腱,拖一根繩子來(lái)傳動(dòng)。還有一種鈦虎的專利,基于平行齒輪、錐齒,再加上三連桿的結(jié)構(gòu)。“如果從美觀度、抗沖擊性、裝配難易程度、成本等各個(gè)方面來(lái)看,第三種方案有其優(yōu)勢(shì)。”易港認(rèn)為。
鈦虎的靈巧手產(chǎn)品
機(jī)器人上半身的發(fā)展,直接決定了它現(xiàn)在能做什么。 當(dāng)然靈巧手的設(shè)計(jì)和應(yīng)用并不容易,在這項(xiàng)技術(shù)成熟之前,采取夾爪(“兩爪”、“三爪”)的方案也未嘗不可,需要有選擇性。比如銀河通用在便利店場(chǎng)景的實(shí)際應(yīng)用中,給機(jī)器人裝上了吸盤(pán)和夾爪兩種末端執(zhí)行器,機(jī)器人可以自主決策需要用哪個(gè),例如在需要拿礦泉水瓶時(shí),夾爪就可以完成任務(wù),但在抓取零食時(shí),吸盤(pán)會(huì)更合適。
同時(shí),銀河通用還在針對(duì)靈巧手展開(kāi)研究,因?yàn)槊鎸?duì)過(guò)寬(夾爪的夾距有限)或光滑的物體,以及柔性物體(比如晾曬衣服,需要用衣架把衣服插起來(lái))、復(fù)雜場(chǎng)景(擰瓶蓋)時(shí),靈巧手或許才是終極解決方案。
相比于AI大模型,在人形機(jī)器人領(lǐng)域,硬件的快速迭代也有很重要的影響。 拿電動(dòng)車(chē)產(chǎn)業(yè)舉例子,傳統(tǒng)燃油車(chē)至少需要三年時(shí)間的研發(fā)、七年時(shí)間的全球銷售,才能收回成本開(kāi)始盈利。但現(xiàn)在中國(guó)的智能電動(dòng)車(chē)企業(yè),已經(jīng)能做到兩年就迭代一個(gè)平臺(tái),因?yàn)槿绻荒茉趦赡曛畠?nèi)迭代一個(gè)平臺(tái)的話,這個(gè)車(chē)型無(wú)論是在智能化方面,還是在續(xù)航里程方面就都跟不上。在光伏產(chǎn)業(yè)也類似,每隔幾年就會(huì)有一個(gè)重要的技術(shù)迭代。一個(gè)新產(chǎn)線如果不能在兩年之內(nèi)實(shí)現(xiàn)產(chǎn)能交付,基本上也會(huì)被淘汰。
而機(jī)器人硬件水平每迭代一次,很多核心性能都會(huì)躍升一個(gè)臺(tái)階,而這恰恰是中國(guó)供應(yīng)鏈的優(yōu)勢(shì)。 比如減速器、電機(jī)的升級(jí),對(duì)精度、力控都有決定性影響,這能極大升級(jí)機(jī)器人的可操作性。一旦研發(fā)成熟,到達(dá)制造環(huán)節(jié),根據(jù)大多數(shù)制造業(yè)的規(guī)律,每當(dāng)產(chǎn)量翻倍,成本將會(huì)降低10-30%,這在光伏和鋰電池行業(yè)中,均有所體現(xiàn)。
“展望未來(lái),整個(gè)機(jī)器人產(chǎn)業(yè)鏈,很可能比現(xiàn)在的汽車(chē)產(chǎn)業(yè)鏈更高一個(gè)量級(jí)。” 易港說(shuō)。
三、“人形機(jī)器人比自動(dòng)駕駛更缺數(shù)據(jù)”
真機(jī)數(shù)據(jù)、仿真數(shù)據(jù)與機(jī)器人的數(shù)據(jù)饑渴癥
“數(shù)據(jù)是AI下一個(gè)發(fā)展階段的最大助推力,但真實(shí)世界的數(shù)據(jù)是遠(yuǎn)遠(yuǎn)不夠的,這需要仿真數(shù)據(jù)來(lái)彌補(bǔ)。” 光輪智能聯(lián)合創(chuàng)始人兼COO楊海波說(shuō),“我們認(rèn)為很快就能找到Scaling Law,那么機(jī)器人也將很快變成數(shù)據(jù)驅(qū)動(dòng),這也是我們做仿真合成數(shù)據(jù)的初衷。”
GPT-3.5之所以能產(chǎn)生劃時(shí)代的突破,核心在于Scaling law,而這離不開(kāi)數(shù)以百億的訓(xùn)練數(shù)據(jù)。訓(xùn)練AI大模型的數(shù)據(jù)在互聯(lián)網(wǎng)上容易獲取,但對(duì)于機(jī)器人來(lái)說(shuō),直接可用的數(shù)據(jù)幾乎為零。
能否獲得高質(zhì)量且足夠便宜的數(shù)據(jù),是當(dāng)下制約機(jī)器人發(fā)展的瓶頸,也是拉開(kāi)公司之間競(jìng)爭(zhēng)的重要手段。 前車(chē)之鑒是Everyday Robots,它曾是谷歌的明星獨(dú)立項(xiàng)目,但在今年2月被谷歌因成本控制而解散,并入谷歌其他部門(mén)。
造成Everyday Robots成本高昂的一個(gè)重要原因,就是數(shù)據(jù)采集成本過(guò)于昂貴。OpenAI曾經(jīng)也有一個(gè)機(jī)器人部門(mén),但后來(lái)放棄了,問(wèn)題也出在數(shù)據(jù)收集上。
為什么采集成本這么高?主要是因?yàn)镋veryday Robots基于真實(shí)環(huán)境來(lái)收集數(shù)據(jù)。谷歌為了訓(xùn)練PaLM-E,用了13臺(tái)機(jī)器人,收集了17個(gè)月,才拿到足夠的數(shù)據(jù)量,如果是在更復(fù)雜的工業(yè)場(chǎng)景,數(shù)據(jù)采集成本會(huì)更高。
機(jī)器人的遙操作
“目前對(duì)于人形機(jī)器人來(lái)說(shuō),主流的數(shù)據(jù)獲取手段分為兩種:一種是真實(shí)數(shù)據(jù),另一種是仿真數(shù)據(jù)。” 楊海波認(rèn)為。
真實(shí)數(shù)據(jù)就是構(gòu)建一個(gè)采集數(shù)據(jù)的基地,在里邊搭建相關(guān)設(shè)備,比如遙操作、動(dòng)作捕捉等等,比如家庭場(chǎng)景里的做飯,捕捉方方面面的動(dòng)作數(shù)據(jù),然后再對(duì)合并數(shù)據(jù)進(jìn)行一些泛化,以及清洗,最終給到模型。
仿真數(shù)據(jù)則是完全在模擬器中進(jìn)行的。首先用虛擬建模的方式,把環(huán)境場(chǎng)景搭建起來(lái),然后再把機(jī)器人虛擬化放進(jìn)去,形成一個(gè)動(dòng)態(tài)的場(chǎng)景。這里面的一切物體,建模都要盡量接近真實(shí),比如需要做一個(gè)蘋(píng)果,那就要制作出大量不同的具體形態(tài),比如不同的光照條件、不同的位置條件、不同的摩擦力情況等等。
從這樣動(dòng)態(tài)場(chǎng)景提取出來(lái)的數(shù)據(jù),其實(shí)是一張張類似于“圖片”的數(shù)據(jù)集,在這些“圖片”上也需要補(bǔ)充針對(duì)性的標(biāo)注,再給到機(jī)器人公司做算法訓(xùn)練。這個(gè)訓(xùn)練過(guò)程,就有點(diǎn)像特斯拉在訓(xùn)練FSD時(shí),拿人類司機(jī)的真實(shí)駕駛視頻訓(xùn)練。
仿真數(shù)據(jù)最核心的要求,就是盡可能的接近真實(shí),真實(shí)度、泛化度都是重要指標(biāo)。 如何符合物理規(guī)律,是目前的一個(gè)難點(diǎn),比如一個(gè)物體是軟還是硬,這就需要更復(fù)雜的參數(shù)設(shè)計(jì)。
由于仿真數(shù)據(jù)多數(shù)是通過(guò)視覺(jué),訓(xùn)練過(guò)程往往是,首先需要判斷出來(lái)這個(gè)物體是什么材質(zhì),比如是個(gè)杯子,然后再去設(shè)計(jì)多大的力量,這個(gè)過(guò)程也可以加入大語(yǔ)言模型的能力。但這與在機(jī)器人的傳動(dòng)結(jié)構(gòu)中,加一個(gè)力觸覺(jué)是不同的技術(shù)方向。
所以,仿真數(shù)據(jù)與遙操作各有優(yōu)劣 。遙操作的優(yōu)勢(shì)在于,在將采集到的數(shù)據(jù)用于訓(xùn)練機(jī)器人后,這一項(xiàng)任務(wù)的成功率會(huì)很高。但劣勢(shì)也很明顯,機(jī)器人的能力缺乏泛化性。
比如在特斯拉訓(xùn)練機(jī)器人分揀電池的例子中,就是通過(guò)人類帶著VR眼鏡,去遙控操作機(jī)器人采集而來(lái)的。通過(guò)這種方法訓(xùn)練出來(lái)的機(jī)器人,幾乎只會(huì)重復(fù)遙操作時(shí)的動(dòng)作,比如把一個(gè)電池放到三乘三的盒子里,但當(dāng)你把電池?fù)Q成礦泉水瓶,同時(shí)將盒子換成更大的四乘六時(shí),機(jī)器人就不知道怎么辦了,這時(shí)候就又需要重新進(jìn)行遙操作再去訓(xùn)練。在沒(méi)有形成海量數(shù)據(jù)的時(shí)候,每做一個(gè)新動(dòng)作都非常吃力,數(shù)據(jù)采集成本很高,并且難以在短時(shí)間獲取大量數(shù)據(jù)。
與遙操作對(duì)比,仿真數(shù)據(jù)的優(yōu)劣勢(shì)幾乎相反。 首先可以用低成本生產(chǎn)海量數(shù)據(jù),同時(shí)機(jī)器人在經(jīng)過(guò)訓(xùn)練以后,能力是泛化的,因?yàn)榭梢苑抡嬷圃煲幌盗兴枰膱?chǎng)景和交互,以使機(jī)器人可以解決各種問(wèn)題。
當(dāng)然,仿真數(shù)據(jù)的劣勢(shì)也很明顯,問(wèn)題主要出在仿真還不夠接近真實(shí),當(dāng)把通過(guò)仿真數(shù)據(jù)訓(xùn)練的機(jī)器人用在真實(shí)場(chǎng)景中時(shí),存在一定的失敗率,比如在抓取任務(wù)中,因?yàn)楣庹铡h(huán)境等各種因素的改變,機(jī)器人可能以為抓到了,但其實(shí)沒(méi)抓到。
提高數(shù)據(jù)規(guī)模,嘗試將大模型訓(xùn)練中的Scaling Law,應(yīng)用在機(jī)器人仿真訓(xùn)練數(shù)據(jù)中,可能是準(zhǔn)確率不足的解決之道。
在王鶴看來(lái),他在一開(kāi)始嘗試用仿真數(shù)據(jù)時(shí),也遭遇了準(zhǔn)確率不足的問(wèn)題。不過(guò)他很快意識(shí)到,當(dāng)時(shí)只用了一個(gè)百萬(wàn)級(jí)的數(shù)據(jù)集,如果把規(guī)模擴(kuò)大會(huì)怎樣?
“我們自己的實(shí)驗(yàn)發(fā)現(xiàn),比如在抓取這個(gè)任務(wù)上,在用靈巧手抓取沒(méi)有見(jiàn)過(guò)的、隨機(jī)亂放的物體時(shí),在有十億次抓取數(shù)據(jù)的情況下,機(jī)器人的成功率能到 86%,如果數(shù)據(jù)量縮到萬(wàn)分之一,也就是 10 萬(wàn)次抓取時(shí),成功率就只有 58%。這說(shuō)明具身智能也有清晰的 scaling law,它對(duì)數(shù)據(jù)有更大渴求。”王鶴說(shuō)。
“傳統(tǒng)的仿真是以測(cè)試為中心的,而為具身智能服務(wù)的仿真,則是需要以訓(xùn)練為中心。”光輪智能CEO謝晨說(shuō),他認(rèn)為好的仿真數(shù)據(jù)首先要有自我真實(shí)性、效用性評(píng)測(cè)能力,如果沒(méi)有這些,仿真數(shù)據(jù)也很難讓客戶的算法有所提升。謝晨曾在英偉達(dá)負(fù)責(zé)自動(dòng)駕駛仿真,國(guó)際首創(chuàng)將生成式AI融入仿真,從0-1開(kāi)發(fā)落地仿真數(shù)據(jù),后選擇回國(guó)創(chuàng)立光輪智能。
“仿真數(shù)據(jù)不會(huì)取代真實(shí)數(shù)據(jù),而是放大它。” 他認(rèn)為終極的Data for AI,會(huì)是真實(shí)的人的示范數(shù)據(jù),與仿真數(shù)據(jù)能力的乘積。
==========================
過(guò)去10年,AI給太多行業(yè)帶來(lái)過(guò)希望和失望。而今天的人形機(jī)器人,正越來(lái)越逼近臨界點(diǎn)。 雖然機(jī)器人至今沒(méi)有清晰的產(chǎn)品形態(tài),但經(jīng)緯創(chuàng)投看到每一家機(jī)器人創(chuàng)業(yè)公司都在嘗試各自的應(yīng)用場(chǎng)景,像已經(jīng)投資的四家機(jī)器人軟硬件一體化公司(宇樹(shù)科技、智元機(jī)器人、銀河通用、星塵智能),再配合著產(chǎn)業(yè)鏈上游的核心一體化關(guān)節(jié)(鈦虎機(jī)器人)、仿真數(shù)據(jù)(光輪智能),都在不同場(chǎng)景下有非常好的應(yīng)用。
這一波人形機(jī)器人公司的短期目標(biāo),都是快速占領(lǐng)各自的應(yīng)用場(chǎng)景,誰(shuí)先把一個(gè)細(xì)分場(chǎng)景做好,積累出足夠多的數(shù)據(jù),就能建立護(hù)城河,再去拓展新領(lǐng)域,最終走向通用化。
而機(jī)器人的發(fā)展離不開(kāi)硬件。與歐美市場(chǎng)對(duì)比,經(jīng)緯創(chuàng)投看到國(guó)內(nèi)很多初創(chuàng)公司的硬件迭代能力,比海外要快很多,成本控制能力更好,在某些硬件細(xì)節(jié)方面超越了海外同行。
全球化幾乎是中國(guó)通用機(jī)器人公司的必選戰(zhàn)略,且與電動(dòng)車(chē)行業(yè)不同,其在全球化中遇到的障礙會(huì)更小。 其中一個(gè)原因是,幾乎沒(méi)有一個(gè)國(guó)家具備有規(guī)模的機(jī)器人產(chǎn)業(yè),此時(shí)出海不會(huì)沖擊當(dāng)?shù)氐漠a(chǎn)業(yè)結(jié)構(gòu),只要產(chǎn)品質(zhì)量和應(yīng)用體驗(yàn)足夠好,出海溢價(jià)可能達(dá)到國(guó)內(nèi)的5倍以上,這將為中國(guó)通用機(jī)器人企業(yè)提供廣闊的國(guó)際市場(chǎng)。
人形機(jī)器人能發(fā)展到今天的位置,來(lái)之不易。“我記得在2016年的時(shí)候,那時(shí)我還在百度,有一次參加完一個(gè)NLP的會(huì)議,結(jié)束之后充滿了挫敗感,感覺(jué)好像這輩子都看不到真正的應(yīng)用,你也不知道那時(shí)的投入到底是不是對(duì)的。”星塵創(chuàng)始人來(lái)杰回憶,“但我也經(jīng)常反思,從我過(guò)去十幾年對(duì)未來(lái)的預(yù)判里,我發(fā)現(xiàn)AI和機(jī)器人整體的發(fā)展速度,又是大大超出我的預(yù)期了。短期內(nèi)你永遠(yuǎn)會(huì)看到很多困難,但這么多聰明的頭腦,其實(shí)在解決一個(gè)又一個(gè)問(wèn)題,產(chǎn)生了一個(gè)又一個(gè)技術(shù)突破,就像有一只巨大的手在促使這個(gè)行業(yè)往上升,這給我?guī)?lái)很大的能量,讓我一直堅(jiān)守在這個(gè)行業(yè)里。”
“技術(shù)是一個(gè)日新月異的事兒,你無(wú)論是在做你的老本行,還是做一件新事,你都有可能明天就被更新的技術(shù)給‘卷’了,AI和機(jī)器人行業(yè)尤其如此。與其說(shuō)按兵不動(dòng),還不如主動(dòng)的去創(chuàng)造變化。” 光輪智能創(chuàng)始人兼CEO謝晨說(shuō),“所以在我看來(lái),現(xiàn)在的創(chuàng)業(yè)成本其實(shí)比之前要低太多了,因?yàn)楝F(xiàn)在不變的成本太高了。 ”
申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!