123,123

在剛剛落幕的AWE2026上，它石智航不僅以全棧技術(shù)首秀成為展館焦點(diǎn)，更迎來(lái)了新華網(wǎng)的專(zhuān)程探訪與深度報(bào)道。

本次新華網(wǎng)報(bào)道深度聚焦它石智航發(fā)布全球首個(gè)「能干活」的通用具身大模型AWE3.0、從數(shù)據(jù)采集到本體執(zhí)行的全棧技術(shù)閉環(huán)、以及創(chuàng)造全新的吉尼斯世界紀(jì)錄等諸多亮點(diǎn)，首席科學(xué)家丁文超博士現(xiàn)場(chǎng)詳解機(jī)器人大腦如何賦能物理世界。

以下為新華網(wǎng)報(bào)道原文：

新華網(wǎng)北京3月18日電 2025年2月，上海一間普通的辦公室里，它石智航剛剛成立。

會(huì)議室里的白板寫(xiě)滿(mǎn)了公式和架構(gòu)圖，它石幾位聯(lián)創(chuàng)圍坐在一起討論。窗外春寒料峭，屋內(nèi)卻熱氣騰騰——他們剛剛決定，要做一件"瘋狂"的事：讓機(jī)器人真正走出實(shí)驗(yàn)室，走進(jìn)工廠，去干那些人類(lèi)覺(jué)得枯燥、危險(xiǎn)、卻又至關(guān)重要的活兒。

一年后，2026年3月的AWE展會(huì)現(xiàn)場(chǎng)，它石智航首席科學(xué)家丁文超博士站在它石的展臺(tái)前，看著A1機(jī)器人在一小時(shí)內(nèi)完成超百次亞毫米級(jí)線(xiàn)束的完整裝配任務(wù)。接過(guò)吉尼斯世界紀(jì)錄證書(shū)的那一刻，他想起了白板上的那些涂鴉。"我們做到了，"他對(duì)記者說(shuō)，"不是炫技、不是表演，是真的能創(chuàng)造價(jià)值、能干活的機(jī)器人。"

今年的政府工作報(bào)告提出"因地制宜發(fā)展新質(zhì)生產(chǎn)力"。在丁文超看來(lái)，具身智能正是AI與實(shí)體經(jīng)濟(jì)深度融合的下一個(gè)主戰(zhàn)場(chǎng)，而它石要做的，就是打破"實(shí)驗(yàn)室樣品"與"產(chǎn)線(xiàn)熟練工"之間那堵看不見(jiàn)的墻。

看見(jiàn)機(jī)器人大腦：從VLA到物理世界理解

過(guò)去幾年，丁文超看過(guò)太多機(jī)器人的“表演”。在實(shí)驗(yàn)室里，在展臺(tái)上，在精心布置的場(chǎng)景中，機(jī)器人可以打開(kāi)水瓶、疊好衣服。但只要換個(gè)角度、換個(gè)環(huán)境，它們就“懵”了。

問(wèn)題出在哪？當(dāng)前具身智能的主流架構(gòu)是VLA（視覺(jué)語(yǔ)言動(dòng)作模型），但丁文超認(rèn)為這遠(yuǎn)遠(yuǎn)不夠。“VLA處理的本質(zhì)是‘視網(wǎng)膜級(jí)’信息——像素、顏色、輪廓。但它石追求的是對(duì)時(shí)間、空間、力及環(huán)境交互等物理量，以及世界本質(zhì)信息的精準(zhǔn)表達(dá)。比如線(xiàn)形變了手會(huì)調(diào)整角度，針刺進(jìn)布里知道用力還是拉直——這些物理直覺(jué)，VLA給不了。”

它石智航本次發(fā)布的全球首個(gè)能干活的通用具身大模型AWE3.0，核心突破在于對(duì)物理世界的感知、理解和規(guī)劃。該模型采用自研AI world Engine架構(gòu)，進(jìn)一步擺脫視角依賴(lài)，具備人類(lèi)般的精細(xì)流暢操作能力、長(zhǎng)程任務(wù)穩(wěn)定執(zhí)行能力，以及跨場(chǎng)景遷移與泛化能力，完美詮釋了“走出溫室、落地干活、通用泛化”的核心定位，更繼承了對(duì)空間規(guī)律與物理法則“知其然，更要知其所以然”的理解、預(yù)測(cè)與推理能力。

這種能力的底層是“隱空間”技術(shù)——將人類(lèi)動(dòng)作精髓壓縮為模型，機(jī)器人不需要記住每一個(gè)動(dòng)作軌跡，而是理解動(dòng)作生成的底層邏輯。“我們借助隱空間的絲滑動(dòng)作生成技術(shù)，讓機(jī)器人的操作行云流水、穩(wěn)定可靠，更將長(zhǎng)程任務(wù)執(zhí)行能力提升至全新高度。”丁文超表示。

在它石AWE展臺(tái)正前方的大腦演示區(qū)，機(jī)器人業(yè)內(nèi)首次對(duì)外直觀展示了這種能力。觀眾可在PAD上選擇酒店、廚房、工廠、辦公等任意場(chǎng)景，并選取拿取、整理、清潔等對(duì)應(yīng)任務(wù)。機(jī)器人在學(xué)習(xí)人類(lèi)真實(shí)數(shù)據(jù)并完成未來(lái)推理后，左屏實(shí)時(shí)呈現(xiàn)真實(shí)場(chǎng)景畫(huà)面，右屏則同步展示點(diǎn)云、關(guān)鍵參數(shù)、運(yùn)動(dòng)軌跡等學(xué)習(xí)數(shù)據(jù)，直觀揭示了機(jī)器人如何通過(guò)海量數(shù)據(jù)學(xué)習(xí)，實(shí)現(xiàn)對(duì)環(huán)境的深度理解與任務(wù)的精準(zhǔn)執(zhí)行。

“我們想讓觀眾看到，機(jī)器人是怎么認(rèn)識(shí)世界、怎么思考、怎么推理未來(lái)的。”丁文超說(shuō)。

數(shù)據(jù)與觸覺(jué)：讓機(jī)器人“長(zhǎng)出手感”的真實(shí)燃料

精細(xì)操作是具身智能最難啃的骨頭。尤其是線(xiàn)束裝配這類(lèi)復(fù)雜、柔性要求高的工業(yè)場(chǎng)景。

它石的答案是HTS（高密度觸覺(jué)感知）技術(shù)，本質(zhì)是將觸覺(jué)反饋閉環(huán)引入控制。讓機(jī)器人擁有堪比人類(lèi)的觸覺(jué)感知能力，能捕捉細(xì)微的數(shù)據(jù)變化，實(shí)現(xiàn)靈活應(yīng)變。

傳統(tǒng)機(jī)器人力控基于關(guān)節(jié)電流反饋，遇到阻力就停。但線(xiàn)束裝配需要“連續(xù)觸覺(jué)”：插接過(guò)程中阻力變化多樣，機(jī)器人需實(shí)時(shí)感知并微調(diào)。HTS讓AWE3.0大幅提升了機(jī)器人對(duì)物理接觸的局部感知和局部響應(yīng)能力，由此機(jī)器人能夠真正勝任精密裝配、線(xiàn)束插接等接觸密集和柔性操作場(chǎng)景，精細(xì)操作能力達(dá)到可落地、可泛化、可規(guī)?；漠a(chǎn)業(yè)標(biāo)準(zhǔn)。

“手上有感覺(jué)，干活才靠譜。”丁文超強(qiáng)調(diào)。

而數(shù)據(jù)是這一切的基礎(chǔ)。具身智能行業(yè)長(zhǎng)期困于數(shù)據(jù)瓶頸：仿真數(shù)據(jù)量大但物理真實(shí)性不足，與現(xiàn)實(shí)存在“仿真-現(xiàn)實(shí)鴻溝”；遙操作數(shù)據(jù)真實(shí)但效率低。它石選擇了第三條路：以人為中心的數(shù)據(jù)采集（Human Centric）。

在這條數(shù)據(jù)采集路線(xiàn)背后，是它石始終貫穿的、對(duì)“有用”的頂層思考：為保障數(shù)據(jù)優(yōu)質(zhì)精細(xì)，它石智航未采用二指夾具、外骨骼等簡(jiǎn)化設(shè)備，而是自主研發(fā)高精度視SenseHub數(shù)據(jù)采集系統(tǒng)，采用可采集全量信息的五指手套，完整捕捉手部空間位姿、手指姿態(tài)及操作力度。該套件實(shí)現(xiàn)感知、計(jì)算與傳輸?shù)纳疃热诤?，為大?guī)模、高質(zhì)量的自然真實(shí)人類(lèi)行為數(shù)據(jù)采集，提供了完整的系統(tǒng)解決方案。

硬件只是基礎(chǔ)，真正的創(chuàng)新在于采集范式：它石讓真實(shí)的從業(yè)者——工廠老師傅、產(chǎn)線(xiàn)工人、保潔阿姨等，佩戴近乎無(wú)感的輕量采集設(shè)備在真實(shí)環(huán)境中工作，確保每一條數(shù)據(jù)都源于真實(shí)動(dòng)作，從而獲取海量、精準(zhǔn)的多模態(tài)數(shù)據(jù)。手套記錄的全量信息，形成了WIYH數(shù)據(jù)集，規(guī)模超百萬(wàn)小時(shí)，覆蓋數(shù)萬(wàn)場(chǎng)景，精準(zhǔn)滿(mǎn)足具身智能對(duì)數(shù)據(jù)真實(shí)、有效、完整的訴求。

“機(jī)器人可用的數(shù)據(jù)，必須同時(shí)滿(mǎn)足三個(gè)條件：務(wù)場(chǎng)景真實(shí)、任務(wù)有效完成、過(guò)程信息全量記錄。”丁文超表示，“這絕非在真實(shí)與仿真數(shù)據(jù)中二選一就能實(shí)現(xiàn)。”

落地與實(shí)干：從吉尼斯紀(jì)錄到產(chǎn)業(yè)賦能

在吉尼斯世界紀(jì)錄的頒證現(xiàn)場(chǎng)，丁文超給全場(chǎng)觀眾講了一個(gè)故事：它石團(tuán)隊(duì)去線(xiàn)束工廠調(diào)研時(shí)，正值盛夏，工人們額頭上全是密密麻麻的汗水。他們?cè)谌藛T密集的車(chē)間，一天重復(fù)同一個(gè)動(dòng)作成千上萬(wàn)次。那個(gè)瞬間，他記了很久。

“為什么要選擇線(xiàn)束這個(gè)場(chǎng)景？一是只要有電就有線(xiàn)束——汽車(chē)、家電、3C，每個(gè)領(lǐng)域都有海量需求；二是這是一個(gè)技術(shù)門(mén)檻極高的場(chǎng)景，理線(xiàn)、插拔、裝配對(duì)傳統(tǒng)機(jī)器人難度極大，因?yàn)榫€(xiàn)是容易形變的，接口是亞毫米級(jí)的，環(huán)境是多變的；三是要把人從這種繁重、重復(fù)、單調(diào)的體力勞動(dòng)中解放出來(lái)。”

吉尼斯紀(jì)錄驗(yàn)證了AWE3.0的工業(yè)落地能力。據(jù)丁文超介紹，當(dāng)前國(guó)內(nèi)機(jī)器人產(chǎn)業(yè)大多仍處于基于預(yù)編程的自動(dòng)化階段，其核心是控制系統(tǒng)而非認(rèn)知系統(tǒng)。具身大腦，正是連接數(shù)字智能與物理世界的關(guān)鍵橋梁。我國(guó)雖擁有成熟的機(jī)器人本體制造能力，但在具備自主感知、認(rèn)知與決策能力的具身基礎(chǔ)模型領(lǐng)域仍存在短板。攻克“具身大腦”，是機(jī)器人產(chǎn)業(yè)實(shí)現(xiàn)核心升級(jí)的必經(jīng)之路。

從產(chǎn)業(yè)視角看，它石智航正具備補(bǔ)齊具身大腦短板的能力，讓機(jī)器人在現(xiàn)實(shí)世界落地、成為能“上崗”的生產(chǎn)力成為可能。

工業(yè)和信息化部人形機(jī)器人標(biāo)準(zhǔn)化技術(shù)委員會(huì)副主任委員兼秘書(shū)長(zhǎng)梁靚對(duì)此評(píng)價(jià)：“當(dāng)前具身智能正從實(shí)驗(yàn)室驗(yàn)證向規(guī)模商業(yè)化跨越，邁入以落地應(yīng)用為核心的新階段。它石智航 AWE3.0的發(fā)布，推動(dòng)機(jī)器人從實(shí)驗(yàn)室走向真實(shí)場(chǎng)景，實(shí)現(xiàn)了從‘會(huì)動(dòng)’到‘會(huì)想’的歷史性跨越。期待以它石為代表的創(chuàng)新企業(yè)，加快成果轉(zhuǎn)化，將技術(shù)優(yōu)勢(shì)轉(zhuǎn)化為產(chǎn)業(yè)優(yōu)勢(shì)，為產(chǎn)業(yè)高質(zhì)量發(fā)展貢獻(xiàn)力量。”

從技術(shù)側(cè)深耕底層創(chuàng)新，到落地側(cè)攻克最難場(chǎng)景訴求，它石智航用實(shí)際行動(dòng)，詮釋了一家踏實(shí)的具身智能企業(yè)應(yīng)有的模樣。

AWE落幕時(shí)，丁文超又去展臺(tái)前站了一會(huì)兒。機(jī)器人已經(jīng)關(guān)機(jī)，幾個(gè)小時(shí)后，它們會(huì)被拆箱、裝車(chē)、運(yùn)回公司繼續(xù)學(xué)習(xí)人類(lèi)的真實(shí)數(shù)據(jù)，繼續(xù)行走在用物理AI改變世界的道路上。

申請(qǐng)創(chuàng)業(yè)報(bào)道，分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處，共同探討創(chuàng)業(yè)新機(jī)遇！

當(dāng)前位置：首頁(yè) > 科技 > IT業(yè)界 > 正文

新華網(wǎng)專(zhuān)訪它石智航首席科學(xué)家丁文超，揭秘全球首個(gè)「能干活」的通用具身大模型AWE3.0

相關(guān)文章

熱門(mén)排行

信息推薦

編輯推薦

阿里一元店是新解“囊”雜貨鋪？

億企聯(lián)解答互聯(lián)網(wǎng)廣告的存在意義何在？

熱門(mén)標(biāo)簽

當(dāng)前位置：首頁(yè) > 科技 > IT業(yè)界 > 正文

新華網(wǎng)專(zhuān)訪它石智航首席科學(xué)家丁文超，揭秘全球首個(gè)「能干活」的通用具身大模型AWE3.0