當(dāng)前位置:首頁(yè) >  科技 >  IT業(yè)界 >  正文

自變量機(jī)器人參與成立RoboChallenge組委會(huì) 開(kāi)源協(xié)作開(kāi)啟標(biāo)準(zhǔn)化新階段

 2025-12-22 10:34  來(lái)源: 互聯(lián)網(wǎng)   我來(lái)投稿 撤稿糾錯(cuò)

  阿里云優(yōu)惠券 先領(lǐng)券再下單

當(dāng)下,人工智能技術(shù)正從“感知智能”邁向“行動(dòng)智能”,如何科學(xué)、公正地評(píng)估機(jī)器人在真實(shí)物理世界中的真實(shí)能力,成為制約行業(yè)發(fā)展的核心命題。就在11月20日,智源研究院、智元機(jī)器人、Qwen、星海圖、自變量、清華大學(xué)、西安交通大學(xué),GOSIM 國(guó)際國(guó)內(nèi)合作伙伴進(jìn)一步攜手,共同推動(dòng)生態(tài)建設(shè),并正式成立 RoboChallenge 組委會(huì)。這標(biāo)志著具身智能真機(jī)測(cè)評(píng)的開(kāi)源協(xié)作不僅邁入了標(biāo)準(zhǔn)化的新階段,更以“開(kāi)放共同體”的行業(yè)共創(chuàng)模式,為具身智能技術(shù)的落地與迭代注入新動(dòng)能。

2025年深圳國(guó)際人工智能展覽會(huì)上,一臺(tái)名為“小量”的機(jī)器人正有條不紊地忙碌著:精準(zhǔn)地拿起杯子,熟練地接取冰塊,細(xì)致地添加各類小料,整個(gè)流程一氣呵成,僅用兩分鐘就呈上一杯色澤誘人的果味冰沙。周圍人群的驚嘆聲此起彼伏,而更令人矚目的,是這臺(tái)機(jī)器人背后那股強(qiáng)大的力量——2023年12月才成立的深圳初創(chuàng)公司自變量機(jī)器人。這家公司雖成立時(shí)間不長(zhǎng),卻已成功斬獲8輪融資,累計(jì)金額超20億元,成為具身智能賽道上一匹耀眼的“黑馬”。而這一切成就的背后,離不開(kāi)阿里、美團(tuán)等巨頭的鼎力支持,以及一位清華學(xué)霸多年堅(jiān)守的機(jī)器人夢(mèng)想。

在自變量機(jī)器人創(chuàng)始人兼CEO王潛的宏偉藍(lán)圖中,單點(diǎn)任務(wù)不過(guò)是通用機(jī)器人走向廣泛應(yīng)用的一個(gè)小小開(kāi)端,他真正的目標(biāo),是讓通用機(jī)器人真正走進(jìn)千家萬(wàn)戶,成為人們生活中不可或缺的一部分。

初心:跨界逐夢(mèng)的機(jī)器人情懷

王潛身上有著清華學(xué)子鮮明的特質(zhì):理性、執(zhí)著且富有遠(yuǎn)見(jiàn)卓識(shí)。他本碩均畢業(yè)于清華大學(xué),是全球最早將注意力機(jī)制引入神經(jīng)網(wǎng)絡(luò)的學(xué)者之一。其相關(guān)研究成果與Google在該領(lǐng)域的首篇論文一同登上頂級(jí)會(huì)議,這一成果后來(lái)更是成為T(mén)ransformer架構(gòu)的核心,為現(xiàn)代大模型技術(shù)奠定了堅(jiān)實(shí)基礎(chǔ)。

在美國(guó)南加州大學(xué)攻讀博士期間,王潛毅然將研究重心轉(zhuǎn)向了自己熱愛(ài)的機(jī)器人領(lǐng)域。他在頂級(jí)機(jī)器人實(shí)驗(yàn)室潛心鉆研多年,深度參與多項(xiàng)機(jī)器人學(xué)習(xí)與人機(jī)交互研究。這段寶貴的經(jīng)歷,讓他深刻認(rèn)識(shí)到傳統(tǒng)機(jī)器人技術(shù)存在的諸多局限,也使得打造通用機(jī)器人的想法在他心中深深扎根。

博士畢業(yè)后,王潛曾在美國(guó)創(chuàng)辦量化基金公司,事業(yè)發(fā)展順風(fēng)順?biāo)H欢?,?nèi)心深處那份對(duì)機(jī)器人的執(zhí)著熱愛(ài)從未消減,“晚上經(jīng)常睡不著,滿腦子都是做機(jī)器人的想法”成了他當(dāng)時(shí)生活的真實(shí)寫(xiě)照。2023年,大語(yǔ)言模型技術(shù)取得突破性進(jìn)展,王潛敏銳地捕捉到機(jī)器人行業(yè)迎來(lái)歷史性機(jī)遇,于是果斷解散基金,毅然回國(guó)創(chuàng)業(yè)。

這一決定并非一時(shí)頭腦發(fā)熱。在他看來(lái),中國(guó)在硬件制造與供應(yīng)鏈領(lǐng)域具備全球領(lǐng)先優(yōu)勢(shì)。“美國(guó)硬件人才大多被大公司的‘金手銬’束縛,而中國(guó)的供應(yīng)鏈優(yōu)勢(shì)可能領(lǐng)先美國(guó)一個(gè)數(shù)量級(jí)。”更關(guān)鍵的是,中國(guó)的數(shù)據(jù)收集成本僅為美國(guó)的十分之一,這為具身智能的研發(fā)提供了核心支撐。

2023年12月18日,王潛初到深圳,自變量機(jī)器人正式宣告成立。這座充滿創(chuàng)新活力的城市,其完善的產(chǎn)業(yè)生態(tài)讓他深感震撼。“實(shí)驗(yàn)室里機(jī)器人所需的硬件及零配件,大多產(chǎn)自深圳,在這里兩天甚至半天就能配齊所有零部件。”深圳強(qiáng)大的“產(chǎn)業(yè)磁場(chǎng)”,成為他實(shí)現(xiàn)夢(mèng)想的理想土壤。

孤勇:堅(jiān)守端到端路線的突圍

自變量機(jī)器人自成立之初,便毅然選擇了一條與眾不同的技術(shù)賽道——“大小腦統(tǒng)一的端到端大模型”路線。這一選擇在當(dāng)時(shí)飽受爭(zhēng)議,甚至遭到業(yè)內(nèi)專家的直接質(zhì)疑。

多年前,當(dāng)王潛首次提出端到端思路時(shí),一位知名機(jī)器人教授當(dāng)面否定:“端到端雖然很有意思,但可能永遠(yuǎn)只是個(gè)玩具,難以真正落地。”面對(duì)質(zhì)疑,王潛始終堅(jiān)守自己的信念,因?yàn)樗钪獋鹘y(tǒng)技術(shù)存在的瓶頸。

所謂端到端模型,與傳統(tǒng)分層架構(gòu)有著本質(zhì)區(qū)別。傳統(tǒng)模式將任務(wù)拆解為感知、規(guī)劃、控制等多個(gè)獨(dú)立模塊,每個(gè)模塊各自運(yùn)作。而端到端模型則通過(guò)統(tǒng)一架構(gòu),實(shí)現(xiàn)從感知、規(guī)劃到控制的全流程閉環(huán)。“分層模型每多一步拆解,就會(huì)引入額外誤差和不可控噪聲,難以實(shí)現(xiàn)可靠執(zhí)行;而端到端統(tǒng)一模型能在‘感知—決策—執(zhí)行’全流程保持連續(xù)性,從根本上解決這一問(wèn)題。”王潛耐心解釋道。

自變量的技術(shù)理念可概括為“縱向統(tǒng)一”與“橫向統(tǒng)一”:縱向?qū)崿F(xiàn)從視頻、傳感器原始輸入到機(jī)器人運(yùn)動(dòng)輸出的全流程由同一模型處理;橫向讓不同任務(wù)共用一個(gè)模型,訓(xùn)練與推理均在統(tǒng)一架構(gòu)下完成。這一理念在WALL - A模型上得到了充分驗(yàn)證,該模型使機(jī)器人僅用二指夾爪,就能輕松完成拉拉鏈、疊衣服、澆花等復(fù)雜操作,數(shù)分鐘級(jí)任務(wù)成功率超過(guò)95%。

突破:從模型迭代到場(chǎng)景驗(yàn)證

自變量機(jī)器人的產(chǎn)品演化軌跡,清晰地印證了其技術(shù)路線的正確性。成立僅兩個(gè)月,公司便成功研發(fā)出第一版具身智能操作模型,可完成切菜、倒水等復(fù)雜操作;2024年底,更是發(fā)布全球最大參數(shù)規(guī)模的具身智能通用操作大模型——Great Wall系列WALL - A模型,實(shí)現(xiàn)了三大核心突破。其一,多模態(tài)信息融合,能夠整合感知數(shù)據(jù)、自然語(yǔ)言指令與運(yùn)動(dòng)控制信號(hào),實(shí)現(xiàn)輸入到輸出的端到端映射;其二,已展現(xiàn)出零樣本泛化能力,在部分未見(jiàn)過(guò)的新任務(wù)場(chǎng)景中無(wú)需重新訓(xùn)練即可適配,這是通用機(jī)器人的關(guān)鍵標(biāo)志;其三,在動(dòng)態(tài)環(huán)境感知、實(shí)時(shí)任務(wù)規(guī)劃和超長(zhǎng)程任務(wù)上取得突破,能完成拉拉鏈、扣扣子、掛衣服等長(zhǎng)序列復(fù)雜操作。

定力:堅(jiān)持真機(jī)數(shù)據(jù)路線

在數(shù)據(jù)策略上,自變量機(jī)器人堅(jiān)持“高質(zhì)量真機(jī)數(shù)據(jù)”路線,與行業(yè)內(nèi)依賴仿真數(shù)據(jù)或互聯(lián)網(wǎng)視頻數(shù)據(jù)的做法截然不同。王潛態(tài)度堅(jiān)決:“所有涉及復(fù)雜物理交互(如接觸豐富的手部操作)不應(yīng)完全使用仿真數(shù)據(jù)。我們探索了十幾年,結(jié)論是手部復(fù)雜操作無(wú)法通過(guò)仿真數(shù)據(jù)進(jìn)化。”

公司構(gòu)建了多渠道數(shù)據(jù)收集體系:集中式數(shù)據(jù)采集場(chǎng)地、分布式現(xiàn)實(shí)環(huán)境收集、機(jī)器人部署后的數(shù)據(jù)回流,從三個(gè)維度保障數(shù)據(jù)質(zhì)量,為模型訓(xùn)練提供堅(jiān)實(shí)支撐。王潛將泛化能力分為四個(gè)層次:基礎(chǔ)條件泛化(適應(yīng)光照、物體位置變化)、跨環(huán)境泛化(從一個(gè)場(chǎng)景擴(kuò)展到多場(chǎng)景)、對(duì)象層面泛化(對(duì)未見(jiàn)過(guò)的同類物體完成任務(wù))、任務(wù)泛化(探索解決未學(xué)習(xí)過(guò)的任務(wù))。目前,自變量模型在前三個(gè)層次已展現(xiàn)出優(yōu)異的通用性。

引力:20億融資背后的巨頭布局

自變量機(jī)器人在資本市場(chǎng)的表現(xiàn)堪稱驚艷:成立不到兩年完成8輪融資,累計(jì)金額超20億元。2025年9月,公司宣布近10億元A + 輪融資,由阿里云、國(guó)科投資領(lǐng)投,國(guó)開(kāi)金融、紅杉中國(guó)等跟投,老股東美團(tuán)、聯(lián)想之星等追投。值得注意的是,這是阿里云首次布局具身智能領(lǐng)域,也是美團(tuán)第二次加注。

阿里、美團(tuán)、京東三大巨頭在具身智能領(lǐng)域的布局邏輯差異明顯。阿里投資數(shù)量最多,已布局10家相關(guān)企業(yè),核心邏輯是通過(guò)云計(jì)算和大模型擴(kuò)展AI應(yīng)用邊界,構(gòu)建具身智能技術(shù)生態(tài);美團(tuán)布局更早更全,從物流、配送機(jī)器人到大模型、AI芯片,覆蓋上下游全鏈條;京東雖起步較晚,但節(jié)奏迅猛,4個(gè)月內(nèi)投資6家企業(yè),聚焦零售、物流、家庭三大垂直場(chǎng)景,打造場(chǎng)景導(dǎo)向的技術(shù)生態(tài)。

路徑:從To B切入,劍指家庭市場(chǎng)

面對(duì)具身智能領(lǐng)域備受爭(zhēng)議的商業(yè)化問(wèn)題,王潛有著清晰且明確的規(guī)劃。他堅(jiān)信“家庭是機(jī)器人最大市場(chǎng),預(yù)計(jì)3 - 4年會(huì)出現(xiàn)早期產(chǎn)品”。經(jīng)濟(jì)學(xué)測(cè)算顯示,人類家務(wù)勞動(dòng)占比高達(dá)四分之一卻未計(jì)入GDP,這意味著家庭機(jī)器人市場(chǎng)潛力巨大,甚至有望超越工業(yè)及其他場(chǎng)景。

自變量機(jī)器人的商業(yè)化路徑確定為“To B切入,逐步延展至To C”。王潛表示,2025年公司將在多個(gè)功能性場(chǎng)景實(shí)現(xiàn)商業(yè)化落地,讓機(jī)器人在開(kāi)放、隨機(jī)場(chǎng)景中自主完成復(fù)雜操作。對(duì)于部分企業(yè)將人形機(jī)器人送入工廠從事簡(jiǎn)單重復(fù)工作的做法,他直言“那其實(shí)就是PR行為”,強(qiáng)調(diào)真正有價(jià)值的商業(yè)化,必須依賴具身智能模型泛化能力的提升。

價(jià)格方面,王潛預(yù)測(cè),消費(fèi)者可接受、產(chǎn)業(yè)鏈可支撐的價(jià)格區(qū)間約為1 - 2萬(wàn)美元(折合人民幣10萬(wàn)元上下),目前仍需通過(guò)產(chǎn)業(yè)鏈優(yōu)化降低成本。他同時(shí)預(yù)判,類GPT - 3水平的具身智能大模型有望一年內(nèi)出現(xiàn),而人形機(jī)器人的“ChatGPT時(shí)刻”則需要3 - 5年。

遠(yuǎn)方:挑戰(zhàn)中構(gòu)建生態(tài)閉環(huán)

盡管自變量機(jī)器人已取得顯著進(jìn)展,但王潛仍清醒地認(rèn)識(shí)到通用機(jī)器人之路充滿挑戰(zhàn)。他指出,當(dāng)前限制機(jī)器人產(chǎn)業(yè)化的核心是“大腦”而非硬件:“展館里不乏運(yùn)動(dòng)能力出色的機(jī)器人,但它們提供的實(shí)用價(jià)值有限,更多是形式價(jià)值。”

面對(duì)挑戰(zhàn),自變量機(jī)器人正積極構(gòu)建具身智能生態(tài)。2025年9月,公司在合肥發(fā)布《具身智能生態(tài)建設(shè)計(jì)劃》,依托自研具身基礎(chǔ)模型,打造全球具身智能創(chuàng)新與產(chǎn)業(yè)核心樞紐;此前,開(kāi)源端到端具身智能基礎(chǔ)模型WALL - OSS,這是全球首個(gè)面向物理世界交互、具備落地能力的開(kāi)源端到端具身智能基礎(chǔ)模型。

對(duì)于長(zhǎng)遠(yuǎn)發(fā)展,王潛明確“軟硬一體”的商業(yè)模式:“機(jī)器人無(wú)法復(fù)制Windows或Android的模式,需軟硬件高度耦合,軟硬一體是最合理的選擇。”

2025年世界機(jī)器人大會(huì)上,搭載WALL - A模型的“量子1號(hào)”機(jī)器人自如地完成制作香囊、整理客廳等復(fù)雜任務(wù),引來(lái)現(xiàn)場(chǎng)觀眾駐足關(guān)注。身高172cm、擁有62個(gè)自由度的“量子2號(hào)”,展現(xiàn)了全棧自研硬件的實(shí)力。王潛站在展臺(tái)旁,冷靜觀察著一切,臉上并無(wú)太多波瀾——對(duì)他而言,展臺(tái)上的掌聲只是前進(jìn)道路上的小小點(diǎn)綴,那個(gè)讓通用機(jī)器人走入千家萬(wàn)戶的夢(mèng)想,正以“深圳速度”一步步從藍(lán)圖變?yōu)楝F(xiàn)實(shí)。

申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)標(biāo)簽
自變量機(jī)器人

相關(guān)文章

  • 巨頭重注的「變量」:自變量機(jī)器人如何定義具身智能新范式

    在科技浪潮洶涌澎湃的當(dāng)下,深圳這座創(chuàng)新之都再次成為焦點(diǎn)。一家成立不到兩年的初創(chuàng)公司——自變量機(jī)器人,憑借近20億元的融資規(guī)模,在具身智能賽道上脫穎而出,背后不僅有阿里、美團(tuán)等巨頭的重注押碼,更承載著一位清華學(xué)霸的機(jī)器人夢(mèng)想。自變量機(jī)器人正以獨(dú)特的魅力,引領(lǐng)著通用機(jī)器人時(shí)代的到來(lái)。夢(mèng)想啟航:學(xué)霸的機(jī)器

    標(biāo)簽:
    自變量機(jī)器人

熱門(mén)排行

信息推薦