當前位置:首頁 >  科技 >  IT業(yè)界 >  正文

新華網(wǎng)專訪它石智航首席科學家丁文超,揭秘全球首個「能干活」的通用具身大模型AWE3.0

 2026-03-19 11:20  來源: 互聯(lián)網(wǎng)   我來投稿 撤稿糾錯

  一鍵部署OpenClaw

在剛剛落幕的AWE2026上,它石智航不僅以全棧技術首秀成為展館焦點,更迎來了新華網(wǎng)的專程探訪與深度報道。

本次新華網(wǎng)報道深度聚焦它石智航發(fā)布全球首個「能干活」的通用具身大模型AWE3.0、從數(shù)據(jù)采集到本體執(zhí)行的全棧技術閉環(huán)、以及創(chuàng)造全新的吉尼斯世界紀錄等諸多亮點,首席科學家丁文超博士現(xiàn)場詳解機器人大腦如何賦能物理世界。

以下為新華網(wǎng)報道原文:

新華網(wǎng)北京3月18日電 2025年2月,上海一間普通的辦公室里,它石智航剛剛成立。

會議室里的白板寫滿了公式和架構圖,它石幾位聯(lián)創(chuàng)圍坐在一起討論。窗外春寒料峭,屋內(nèi)卻熱氣騰騰——他們剛剛決定,要做一件"瘋狂"的事:讓機器人真正走出實驗室,走進工廠,去干那些人類覺得枯燥、危險、卻又至關重要的活兒。

一年后,2026年3月的AWE展會現(xiàn)場,它石智航首席科學家丁文超博士站在它石的展臺前,看著A1機器人在一小時內(nèi)完成超百次亞毫米級線束的完整裝配任務。接過吉尼斯世界紀錄證書的那一刻,他想起了白板上的那些涂鴉。"我們做到了,"他對記者說,"不是炫技、不是表演,是真的能創(chuàng)造價值、能干活的機器人。"

今年的政府工作報告提出"因地制宜發(fā)展新質(zhì)生產(chǎn)力"。在丁文超看來,具身智能正是AI與實體經(jīng)濟深度融合的下一個主戰(zhàn)場,而它石要做的,就是打破"實驗室樣品"與"產(chǎn)線熟練工"之間那堵看不見的墻。

看見機器人大腦:從VLA到物理世界理解

過去幾年,丁文超看過太多機器人的“表演”。在實驗室里,在展臺上,在精心布置的場景中,機器人可以打開水瓶、疊好衣服。但只要換個角度、換個環(huán)境,它們就“懵”了。

問題出在哪?當前具身智能的主流架構是VLA(視覺語言動作模型),但丁文超認為這遠遠不夠。“VLA處理的本質(zhì)是‘視網(wǎng)膜級’信息——像素、顏色、輪廓。但它石追求的是對時間、空間、力及環(huán)境交互等物理量,以及世界本質(zhì)信息的精準表達。比如線形變了手會調(diào)整角度,針刺進布里知道用力還是拉直——這些物理直覺,VLA給不了。”

它石智航本次發(fā)布的全球首個能干活的通用具身大模型AWE3.0,核心突破在于對物理世界的感知、理解和規(guī)劃。該模型采用自研AI world Engine架構,進一步擺脫視角依賴,具備人類般的精細流暢操作能力、長程任務穩(wěn)定執(zhí)行能力,以及跨場景遷移與泛化能力,完美詮釋了“走出溫室、落地干活、通用泛化”的核心定位,更繼承了對空間規(guī)律與物理法則“知其然,更要知其所以然”的理解、預測與推理能力。

這種能力的底層是“隱空間”技術——將人類動作精髓壓縮為模型,機器人不需要記住每一個動作軌跡,而是理解動作生成的底層邏輯。“我們借助隱空間的絲滑動作生成技術,讓機器人的操作行云流水、穩(wěn)定可靠,更將長程任務執(zhí)行能力提升至全新高度。”丁文超表示。

在它石AWE展臺正前方的大腦演示區(qū),機器人業(yè)內(nèi)首次對外直觀展示了這種能力。觀眾可在PAD上選擇酒店、廚房、工廠、辦公等任意場景,并選取拿取、整理、清潔等對應任務。機器人在學習人類真實數(shù)據(jù)并完成未來推理后,左屏實時呈現(xiàn)真實場景畫面,右屏則同步展示點云、關鍵參數(shù)、運動軌跡等學習數(shù)據(jù),直觀揭示了機器人如何通過海量數(shù)據(jù)學習,實現(xiàn)對環(huán)境的深度理解與任務的精準執(zhí)行。

“我們想讓觀眾看到,機器人是怎么認識世界、怎么思考、怎么推理未來的。”丁文超說。

數(shù)據(jù)與觸覺:讓機器人“長出手感”的真實燃料

精細操作是具身智能最難啃的骨頭。尤其是線束裝配這類復雜、柔性要求高的工業(yè)場景。

它石的答案是HTS(高密度觸覺感知)技術,本質(zhì)是將觸覺反饋閉環(huán)引入控制。讓機器人擁有堪比人類的觸覺感知能力,能捕捉細微的數(shù)據(jù)變化,實現(xiàn)靈活應變。

傳統(tǒng)機器人力控基于關節(jié)電流反饋,遇到阻力就停。但線束裝配需要“連續(xù)觸覺”:插接過程中阻力變化多樣,機器人需實時感知并微調(diào)。HTS讓AWE3.0大幅提升了機器人對物理接觸的局部感知和局部響應能力,由此機器人能夠真正勝任精密裝配、線束插接等接觸密集和柔性操作場景,精細操作能力達到可落地、可泛化、可規(guī)模化的產(chǎn)業(yè)標準。 

“手上有感覺,干活才靠譜。”丁文超強調(diào)。

而數(shù)據(jù)是這一切的基礎。具身智能行業(yè)長期困于數(shù)據(jù)瓶頸:仿真數(shù)據(jù)量大但物理真實性不足,與現(xiàn)實存在“仿真-現(xiàn)實鴻溝”;遙操作數(shù)據(jù)真實但效率低。它石選擇了第三條路:以人為中心的數(shù)據(jù)采集(Human Centric)。

在這條數(shù)據(jù)采集路線背后,是它石始終貫穿的、對“有用”的頂層思考:為保障數(shù)據(jù)優(yōu)質(zhì)精細,它石智航未采用二指夾具、外骨骼等簡化設備,而是自主研發(fā)高精度視SenseHub數(shù)據(jù)采集系統(tǒng),采用可采集全量信息的五指手套,完整捕捉手部空間位姿、手指姿態(tài)及操作力度。該套件實現(xiàn)感知、計算與傳輸?shù)纳疃热诤希瑸榇笠?guī)模、高質(zhì)量的自然真實人類行為數(shù)據(jù)采集,提供了完整的系統(tǒng)解決方案。

硬件只是基礎,真正的創(chuàng)新在于采集范式:它石讓真實的從業(yè)者——工廠老師傅、產(chǎn)線工人、保潔阿姨等,佩戴近乎無感的輕量采集設備在真實環(huán)境中工作,確保每一條數(shù)據(jù)都源于真實動作,從而獲取海量、精準的多模態(tài)數(shù)據(jù)。手套記錄的全量信息,形成了WIYH數(shù)據(jù)集,規(guī)模超百萬小時,覆蓋數(shù)萬場景,精準滿足具身智能對數(shù)據(jù)真實、有效、完整的訴求。

“機器人可用的數(shù)據(jù),必須同時滿足三個條件:務場景真實、任務有效完成、過程信息全量記錄。”丁文超表示,“這絕非在真實與仿真數(shù)據(jù)中二選一就能實現(xiàn)。”

落地與實干:從吉尼斯紀錄到產(chǎn)業(yè)賦能

在吉尼斯世界紀錄的頒證現(xiàn)場,丁文超給全場觀眾講了一個故事:它石團隊去線束工廠調(diào)研時,正值盛夏,工人們額頭上全是密密麻麻的汗水。他們在人員密集的車間,一天重復同一個動作成千上萬次。那個瞬間,他記了很久。

“為什么要選擇線束這個場景?一是只要有電就有線束——汽車、家電、3C,每個領域都有海量需求;二是這是一個技術門檻極高的場景,理線、插拔、裝配對傳統(tǒng)機器人難度極大,因為線是容易形變的,接口是亞毫米級的,環(huán)境是多變的;三是要把人從這種繁重、重復、單調(diào)的體力勞動中解放出來。”

吉尼斯紀錄驗證了AWE3.0的工業(yè)落地能力。據(jù)丁文超介紹,當前國內(nèi)機器人產(chǎn)業(yè)大多仍處于基于預編程的自動化階段,其核心是控制系統(tǒng)而非認知系統(tǒng)。具身大腦,正是連接數(shù)字智能與物理世界的關鍵橋梁。我國雖擁有成熟的機器人本體制造能力,但在具備自主感知、認知與決策能力的具身基礎模型領域仍存在短板。攻克“具身大腦”,是機器人產(chǎn)業(yè)實現(xiàn)核心升級的必經(jīng)之路。

從產(chǎn)業(yè)視角看,它石智航正具備補齊具身大腦短板的能力,讓機器人在現(xiàn)實世界落地、成為能“上崗”的生產(chǎn)力成為可能。

工業(yè)和信息化部人形機器人標準化技術委員會副主任委員兼秘書長梁靚對此評價:“當前具身智能正從實驗室驗證向規(guī)模商業(yè)化跨越,邁入以落地應用為核心的新階段。它石智航 AWE3.0的發(fā)布,推動機器人從實驗室走向真實場景,實現(xiàn)了從‘會動’到‘會想’的歷史性跨越。期待以它石為代表的創(chuàng)新企業(yè),加快成果轉化,將技術優(yōu)勢轉化為產(chǎn)業(yè)優(yōu)勢,為產(chǎn)業(yè)高質(zhì)量發(fā)展貢獻力量。”

從技術側深耕底層創(chuàng)新,到落地側攻克最難場景訴求,它石智航用實際行動,詮釋了一家踏實的具身智能企業(yè)應有的模樣。

AWE落幕時,丁文超又去展臺前站了一會兒。機器人已經(jīng)關機,幾個小時后,它們會被拆箱、裝車、運回公司繼續(xù)學習人類的真實數(shù)據(jù),繼續(xù)行走在用物理AI改變世界的道路上。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關標簽
新華網(wǎng)

相關文章

熱門排行

信息推薦