還在玩只限于人臉的AR玩法嗎?一鍵美體塑形、視頻體感游戲、用手機就能玩虛擬形象全身驅(qū)動……隨著5G即將全面普及以及智能圖形技術(shù)的不斷創(chuàng)新,原本受限于高端硬件的全身AR技術(shù),現(xiàn)在用智能手機就能玩,視頻AR玩法也將全面進入了全身時代。
相芯科技此次對人體AI技術(shù)進行全面升級,在視頻AR特效的功能基礎(chǔ)上進行玩法升級,同時新增開放7大功能的算法接口,分別是2D人體關(guān)鍵點、3D人體骨骼、人像分割、頭部分割、頭發(fā)分割、動作識別、手勢識別。每項技術(shù)革新背后都能帶來新的應(yīng)用層的火花,相芯更新的技術(shù)效果到底如何,一起來看下吧。

打開APP 閱讀最新報道一、2D人體關(guān)鍵點
通過2D人體關(guān)鍵點算法接口,實現(xiàn)人體全身2D關(guān)鍵點的跟蹤效果,點位準(zhǔn)確性高,即使做大幅度動作、遮擋以及轉(zhuǎn)身的情況下,也能準(zhǔn)確穩(wěn)定跟蹤。同時針對用戶在短視頻、直播拍攝時的自拍場景,2D人體關(guān)鍵點還提供半身模式的點位跟蹤,這樣用戶在單手持手機自拍的情況下,也能準(zhǔn)確定位人體數(shù)據(jù)。

在高精度的人體關(guān)鍵點模型的基礎(chǔ)上,對視頻中的人物實現(xiàn)全身美體功能,是這項技術(shù)比較熱門的應(yīng)用場景。相芯的技術(shù),可以從瘦身、長腿、細腰、美肩、美臀、小頭、瘦腿等七個美化維度,對人物的身體進行精細化調(diào)整,從而達到一件瘦身塑形的作用。

二、3D人體骨骼
相芯科技開放的3D人體骨骼的算法接口,主要應(yīng)用于基于3D關(guān)鍵點和3D骨骼,實現(xiàn)3D虛擬形象的全身驅(qū)動。這項技術(shù)不依賴于深度攝像頭,只需要手機的普通攝像頭就能獲得視頻中的人體3D骨骼數(shù)據(jù),即使人物做大幅度的動作、有動作遮擋、轉(zhuǎn)身等情況都能穩(wěn)定跟蹤。除了身體軀干動作,在手指細節(jié)上,也能識別和跟蹤常見的14種手勢。讓3D虛擬形象能夠更細膩地復(fù)原人物的動作。同樣針對他人拍攝和自拍兩種拍攝場景,相芯提供全身和半身兩種模式,支持3D人體骨骼數(shù)據(jù)的輸出。

三、人像分割
通過人像分割的算法接口,可對輸入的視頻進行內(nèi)容理解,將人物進行高精分割解析,將人像區(qū)域分離出來,并實時追蹤。例如視頻直播過程中,識別用戶的人體輪廓,為人物實時替換各種背景特效。也可以與各具創(chuàng)意的人體AR貼紙相結(jié)合,讓貼紙實時跟隨人體移動,貼紙素材與人體的前后位置關(guān)系可靈活定義,可以充分發(fā)揮運營者的互動創(chuàng)意,為用戶帶來更加豐富的娛樂體驗。

四、頭部分割
通過頭部分割接口,企業(yè)和開發(fā)者可以對人物頭部區(qū)域做更多的特效創(chuàng)意。例如搞笑大頭玩法特效,可以實現(xiàn)視頻中的人物頭部放大的萌態(tài)效果。這項技術(shù)還能和其他技術(shù)進行組合實現(xiàn)更加新穎的玩法效果。比如將頭部分割和表情系數(shù)結(jié)合,即可用特點的表情,觸發(fā)大頭效果,并用表情的夸張程度來實時控制頭部的放大程度。用頭部分割+哈哈鏡+AR貼紙這樣的技術(shù)組合,就可以實效惡搞版的效果,充分發(fā)揮腦洞創(chuàng)意。

五、頭發(fā)分割
通過頭發(fā)分割接口,可以在視頻和照片中人物的頭發(fā)區(qū)域高精度地分離出來,可以給頭發(fā)切換各種各樣的顏色,可以是純色,也可以是漸變色,實現(xiàn)一鍵換發(fā)色的特效。同時頭發(fā)的色值支持自定義,并可以進行上色程度的調(diào)整,實現(xiàn)想要的發(fā)色,想換就換。

六、動作識別
相芯科技的動作識別接口,能夠支持15種全身動作的識別。將動作識別和匹配算法相結(jié)合,可以開發(fā)出各種體感小游戲,比如“尬舞機”游戲,跟著屏幕的動作提示即可開始跳舞了。同時動作識別也可以與AR貼紙相結(jié)合,用特定動作來觸發(fā)貼紙?zhí)匦?充分發(fā)揮體感互動的娛樂性。

七、手勢識別
通過手勢識別接口,可精準(zhǔn)識別常見的14種手勢動作。在短視頻直播領(lǐng)域,用戶在拍視頻和拍照過程中,可以通過手勢動作來觸發(fā)各種貼紙?zhí)匦?從而衍生出創(chuàng)意視頻的各種玩法。同時,在智能設(shè)備領(lǐng)域,比如智能家電、智能機器人、可穿戴設(shè)備、智能互動大屏等智能硬件,可以實現(xiàn)用手勢控制對應(yīng)的功能。用戶在不接觸設(shè)備的情況下,通過簡單的手勢,就能實現(xiàn)對設(shè)備的交互和控制,讓人機交互方式更加智能化、自然化。

相芯科技專注于人工智能和計算機圖形學(xué)的融合與創(chuàng)新,致力于為消費級應(yīng)用提供內(nèi)容創(chuàng)作工具、平臺和解決方案。相芯科技的人臉人體AI解決方案目前已累計服務(wù)700多家B端客戶,產(chǎn)品被廣泛應(yīng)用于短視頻、直播、社交、游戲、智能家居、在線教育、廣告營銷、新零售等領(lǐng)域,月均調(diào)用量達40億。
此次的人體AI SDK大更新,相芯針對不同體驗需求推出了兩個版本的體驗demo,分別是特效版和算法版demo。
【特效版demo】模擬真實的用戶應(yīng)用場景,提供技術(shù)的功能演示和體驗,可以在這個demo里面直觀體驗美顏、美妝、道具貼紙、Animoji、美發(fā)、輕美妝、AR面具、搞笑大頭、海報換臉、表情識別、音樂濾鏡、哈哈鏡、美體、全身Avatar、動作識別、人像分割、手勢識別等功能。
同時針對開發(fā)者用戶,為了能更好地體驗各個功能接口在算法層的效果,相芯全新推出【算法版demo】,使用這個demo就能直觀地看到各種人體關(guān)鍵點、人體骨骼、mask類功能的算法效果,便于進一步開發(fā)使用。目前開放的接口為2D人體關(guān)鍵點、3D人體骨骼、人像分割、頭部分割、頭發(fā)分割、動作識別、手勢識別。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!
2025年10月25日,2025世界青年科學(xué)家峰會之人工智能(AI)融合創(chuàng)新發(fā)展論壇在浙江溫州成功舉辦。本次論壇由國際院士科創(chuàng)中心主辦,中國投資協(xié)會能源投資專業(yè)委員會、溫港院士科創(chuàng)中心承辦,中國電工技術(shù)學(xué)會、中科先進技術(shù)溫州研究院與溫州市電力工程學(xué)會提供支持,以“甌江論道-AI賦能綠色發(fā)展”為主題,
個人創(chuàng)業(yè)需要啟動成本低、無需龐大團隊、可快速驗證、能利用個人技能或資源。這里分享適合個人創(chuàng)業(yè)的十個機會一.AI內(nèi)容優(yōu)化與本地化服務(wù)·做什么:幫助企業(yè)或個人利用AI工具(如GPT-4,Midjourney)優(yōu)化內(nèi)容生產(chǎn)流程。例如,為跨境電商撰寫多語言產(chǎn)品描述,為小紅書博主生成爆款文案,為小公司制作營銷
百度AI團隊今日正式推出PaddleOCR3.1版本,以突破性的多語言組合識別(MultilingualCompositionPerception,MCP)技術(shù)為核心,徹底重構(gòu)復(fù)雜文檔處理邊界。此次升級標(biāo)志著OCR領(lǐng)域首次實現(xiàn)對同一文檔內(nèi)任意混合語言文本的精準(zhǔn)識別,為全球化企業(yè)、跨境業(yè)務(wù)及多元文化場
導(dǎo)航網(wǎng)站的崛起:從信息過載到精準(zhǔn)觸達隨著全球AI工具數(shù)量爆發(fā)式增長(2025年已超數(shù)萬款),用戶面臨前所未有的選擇困境。傳統(tǒng)搜索引擎的“關(guān)鍵詞-鏈接”模式難以應(yīng)對工具篩選的場景需求,垂直化、場景化的AI導(dǎo)航網(wǎng)站應(yīng)運而生。這類平臺通過聚合、評測、分類與推薦四重機制,將分散的工具資源整合為結(jié)構(gòu)化入口。例
當(dāng)微信公眾號文章中出現(xiàn)一個人的名字,它會自動變成藍色鏈接,點擊即可查看AI生成的“個人簡歷”——這一微信新功能讓不少用戶感到被“扒光”在互聯(lián)網(wǎng)上。近日,微信新上線的“AI搜索”功能陷入隱私泄露爭議漩渦。多位網(wǎng)友在社交平臺反映,當(dāng)微信公眾號推文中出現(xiàn)本人姓名時,名字會自動變?yōu)樗{色超鏈接,點擊即可瀏覽由
文/楊雪健來源/節(jié)點財經(jīng)Meta或迎來史上最大規(guī)模裁員潮。2026年3月14日,路透社曝出Meta正計劃啟動新一輪大規(guī)模裁員,此次裁員比例或達公司總員工數(shù)的20%,按其近7.9萬的員工規(guī)模計算,約1.58萬名員工或?qū)⒈徊谩H粼撚媱潏?zhí)行,將成為Meta自2022年底實行“效率之年”重組后規(guī)模最大的一次
3月17日,阿里發(fā)布全球首個企業(yè)級AI原生工作平臺——“悟空”,讓每個團隊、每家公司,都能擁有一支24h工作的”龍蝦軍團”。悟空是一款獨立應(yīng)用,即日起開啟邀測,也將直接內(nèi)置到超2000萬企業(yè)組織的釘釘之中。擁有8億用戶的釘釘重寫底層代碼,進行全面CLI(命令行界面)化改造,讓悟空Agent能夠原生操
AI的“免費紅利期”結(jié)束了,未來18個月,靠“API倒賣”的公司,會成片消失。這個導(dǎo)火索就是最近Google的一輪封號導(dǎo)致的,隨著封號風(fēng)波的結(jié)束,這也標(biāo)志著AI行業(yè)【收租時代】來了。2月封號潮:高付費用戶被一鍋端一周前,Google開始大規(guī)模封號,付著250美金月費的人,賬號說沒就沒,Gmail、Y
來自路透社等媒體報道的最新消息:DeepSeek未發(fā)布的V4Lite模型遭泄露上網(wǎng),華為獲得早期訪問權(quán)限,英偉達被排除在外。近期,谷歌發(fā)表了2篇Multi-Agent協(xié)作學(xué)習(xí)新論文有網(wǎng)友提供了更加詳細的信息,DeepSeekV4Lite:100萬token上下文窗口(V3為128K)內(nèi)置原生多模態(tài)推
春節(jié)紅包會結(jié)束,但AI已融入數(shù)億人生活里
性能、商業(yè)、生態(tài)詮釋開源模型的最佳姿態(tài)
2026年剛開年,全世界最狂的那個男人,穿著他的經(jīng)典黑皮衣,在CES舞臺上發(fā)出了未來十年的信號。他搞了個“能吃飽套餐”:6個包子+一碟小菜+一碗粥=肉包子套餐,這樣以后你只要買一個套餐就能吃飽了。(Rubin平臺)同時他們店里還免費提供的筷子、勺子、蘸料、醬油、醋、水果、零食等等。(開放10萬億語言
12月12日-14日,2025全球開發(fā)者先鋒大會暨國際具身智能技能大賽(GDPS2025)于上海張江科學(xué)會堂舉行,大會以具身智能競技為核心,融合了技術(shù)比拼、產(chǎn)業(yè)展示與科普體驗,為全球觀眾呈現(xiàn)出具身智能的現(xiàn)在與未來。上海開普勒機器人有限公司(以下簡稱"開普勒機器人")攜明星產(chǎn)品K2"大黃蜂"亮相,并參
在數(shù)字化與智能化深度交織的時代浪潮中,安全的邊界不斷延展,技術(shù)的演進正引領(lǐng)產(chǎn)業(yè)邁向新一輪變革。10月24日,以“弈動Dynamic·數(shù)智躍遷博弈無界”為主題的2025TechWorld智慧安全大會在北京盛大召開。來自國家部委、院士學(xué)者、高??蒲袡C構(gòu)和企業(yè)的權(quán)威專家與業(yè)界精英齊聚北京,共議AI安全、數(shù)
2025年10月25日,2025世界青年科學(xué)家峰會之人工智能(AI)融合創(chuàng)新發(fā)展論壇在浙江溫州成功舉辦。本次論壇由國際院士科創(chuàng)中心主辦,中國投資協(xié)會能源投資專業(yè)委員會、溫港院士科創(chuàng)中心承辦,中國電工技術(shù)學(xué)會、中科先進技術(shù)溫州研究院與溫州市電力工程學(xué)會提供支持,以“甌江論道-AI賦能綠色發(fā)展”為主題,