遠(yuǎn)傳科技從未停止“造人”的腳步。
除了有“AI虛擬主播”之外,現(xiàn)在連“數(shù)字主持人”也來(lái)了,“數(shù)字主持人”到底是什么呢?

遠(yuǎn)傳科技的“數(shù)字主持人”是通過(guò)語(yǔ)音合成、唇形合成、表情合成以及深度學(xué)習(xí)等技術(shù),克隆出具備和真人主播一樣播報(bào)能力的數(shù)字人。通過(guò)語(yǔ)音合成技術(shù)和視頻驅(qū)動(dòng)技術(shù),只需要輸入一段文本,它就能在屏幕展現(xiàn)虛擬數(shù)字人形象并進(jìn)行新聞播報(bào),且唇形動(dòng)作能與播報(bào)聲音實(shí)時(shí)同步。
或許在不久的未來(lái),你再也分不清視頻中的主持人,究竟是真人還是虛擬人,而這一天正在到來(lái)。
一、根源探究:「高逼真」的背后
遠(yuǎn)傳科技“數(shù)字主持人”以真人為原型,通過(guò)將真人形象數(shù)字化掃描技術(shù),建立超寫(xiě)實(shí) 3D 數(shù)字人建模,多模態(tài)識(shí)別及生成、實(shí)時(shí)面部動(dòng)作生成及驅(qū)動(dòng)、遷移學(xué)習(xí)等技術(shù)「熔爐」,煉就而成。
從效果上來(lái)說(shuō),3D AI 合成主播給人的最大印象便是高逼真,它較好的還原了真人的發(fā)膚、表情;同時(shí),靈活性、可塑性更強(qiáng),擁有的豐富的面部表情動(dòng)作,嘴部唇動(dòng),以及身體的輕微擺動(dòng),具備在更廣闊空間使用的潛力。

透過(guò) 3D AI 合成主播技術(shù)實(shí)現(xiàn)過(guò)程,我們探究它為何擁有如此逼真的效果。
1.數(shù)字化掃描技術(shù)還原真人形象
建立人物模型必須要有海量數(shù)據(jù),遠(yuǎn)傳科技數(shù)字化掃描技術(shù)通過(guò)攝像頭對(duì)真人原型的身體各個(gè)部位進(jìn)行全方位「打點(diǎn)」掃描,采集每一處細(xì)節(jié),并對(duì)其多種形態(tài)的面部表情動(dòng)作,嘴部唇動(dòng),以及身體的輕微擺動(dòng)進(jìn)行細(xì)致入微地捕捉記錄,還原真人形象。
2.深度學(xué)習(xí)算法生成3D數(shù)字人模型
遠(yuǎn)傳科技算法工程師熟練應(yīng)用深度學(xué)習(xí)算法,對(duì)算法里的大量參數(shù)進(jìn)行調(diào)優(yōu),確保生成的3D數(shù)字人模型能夠精確的還原真人在正常說(shuō)話時(shí)候的唇部動(dòng)作,臉部表情及微動(dòng)作,對(duì)3D數(shù)字人模型進(jìn)行實(shí)時(shí)驅(qū)動(dòng)、渲染,使其面部肌肉驅(qū)動(dòng)、表情肢體和語(yǔ)言表達(dá)能力達(dá)到一個(gè)較高的度契合。確保非專(zhuān)業(yè)人士無(wú)法分辨出是真人拍攝的視頻還是通過(guò)數(shù)字技術(shù)合成出來(lái)的視頻。
二、核心亮點(diǎn): AI 驅(qū)動(dòng)、多模態(tài)交互
1.AI 驅(qū)動(dòng)的 3D 數(shù)字人
遠(yuǎn)傳科技“數(shù)字主持人”是一種由AI所驅(qū)動(dòng)的虛擬存在,擁有和真人一致的音容、笑貌和言談舉止,擁有表達(dá)情感和智慧的能力。仔細(xì)觀察你會(huì)發(fā)現(xiàn), 3D AI 合成主播是基于 AI 算法實(shí)現(xiàn)驅(qū)動(dòng)。
具體來(lái)說(shuō),3D “數(shù)字主持人”靠 AI 算法實(shí)時(shí)驅(qū)動(dòng),輸入一個(gè)文本就能輸出一個(gè)視頻,往往生成一個(gè) 1 分鐘的視頻,僅只需要 1 分鐘,幾乎可以看作實(shí)時(shí)生成。
2.關(guān)鍵技術(shù)賦能多模態(tài)交互創(chuàng)新
唇動(dòng)算法、3D建模技術(shù)、深度學(xué)習(xí)算法、5G通信等關(guān)鍵技術(shù)探索文本、語(yǔ)音和視覺(jué)多模態(tài)交互創(chuàng)新的無(wú)限可能。
遠(yuǎn)傳科技利用唇動(dòng)算法分析出數(shù)字人應(yīng)顯示的口型標(biāo)記,突破語(yǔ)言交流過(guò)程的表情和唇動(dòng)的無(wú)縫鏈接;根據(jù)給定人物形象要求,建立數(shù)字人3D模型,綁定骨骼,創(chuàng)立動(dòng)作動(dòng)畫(huà)和口型動(dòng)畫(huà);基于深度學(xué)習(xí)算法、肢體捕捉技術(shù),將文本、音頻和圖片實(shí)時(shí)生成數(shù)字人視頻;5G通信技術(shù)則讓用戶跟數(shù)字人進(jìn)行語(yǔ)音視頻互動(dòng)成為可能,麥克風(fēng)和攝像頭捕捉用戶的語(yǔ)音和動(dòng)作,數(shù)字人的后端人工智能算法根據(jù)場(chǎng)景生成對(duì)應(yīng)的數(shù)字人交互動(dòng)作、表情和語(yǔ)音。

三、未來(lái)已來(lái),你準(zhǔn)備好了嗎?
遠(yuǎn)傳科技“數(shù)字主持人”雖然基于真實(shí)的人進(jìn)行建模,但呈現(xiàn)在人們面前的行為都是完全逼真的,能像真實(shí)主播一樣,去笑,去哭,去表達(dá),是被創(chuàng)造出來(lái)的一個(gè)“數(shù)字人”。
數(shù)字人的未來(lái)將會(huì)作為主體人的一個(gè)副本形式存在于數(shù)字世界中,在未來(lái)的數(shù)字世界中我們將無(wú)法分辨出真人和數(shù)字人,大量在數(shù)字世界的服務(wù)將都會(huì)由數(shù)字人來(lái)代替,在電話客戶服務(wù)、線上產(chǎn)品講解、電商直播甚至線上演唱會(huì)等眾多場(chǎng)景都將會(huì)有數(shù)字人的角色參與,數(shù)字化終極未來(lái)也許就是數(shù)字人的世界。
你準(zhǔn)備好接受一個(gè)數(shù)字世界了嗎?
申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!
隨著VisionPro量產(chǎn)時(shí)間的臨近,VR概念再次映入人們的視野,業(yè)內(nèi)“炒作VR”的浪潮,似乎也有了重新抬頭的跡象。
繼VisionPro之后,蘋(píng)果正在籌備VisionPro的“平替版”6月初,蘋(píng)果公司發(fā)布了其第一代MR頭顯——VisionPro,產(chǎn)品一經(jīng)發(fā)布,便在科技圈引起熱議。甚至庫(kù)克本人在發(fā)布會(huì)上表示:“就像Mac讓我們接觸到個(gè)人電腦,iPhone讓我們接觸到移動(dòng)計(jì)算一樣,VisionPro將向我們介紹空間計(jì)
全球數(shù)字貿(mào)易迅猛發(fā)展下,第三方外貿(mào)支付機(jī)構(gòu)的角色已經(jīng)從支付服務(wù)進(jìn)化為數(shù)字化綜合服務(wù),在資金流通、守護(hù)資金安全等方面也根據(jù)廣大企業(yè)時(shí)代背景下的新需求需要承擔(dān)更多的職責(zé)。同時(shí),隨著大數(shù)據(jù)、人工智能等數(shù)字技術(shù)對(duì)貿(mào)易各經(jīng)濟(jì)領(lǐng)域的滲透,對(duì)于外貿(mào)支付來(lái)說(shuō),這也意味著能整合和發(fā)揮自身天然的數(shù)字化能力和資源優(yōu)勢(shì)將成
空間計(jì)算時(shí)代拉開(kāi)序幕。
第81屆中國(guó)教育裝備展示會(huì)于4月21日-23日在江西南昌綠地國(guó)際博覽中心如期舉辦。展會(huì)上,大朋VR旗下產(chǎn)品在包括萌科科技、東湃科技、矩道網(wǎng)絡(luò)在內(nèi)的多家教育培訓(xùn)內(nèi)容商聯(lián)合展區(qū)之中頻頻亮相,展示內(nèi)容囊括元宇宙教育、消防安全教育、K12現(xiàn)代化教育等諸多領(lǐng)域,吸引了眾多關(guān)注。教育領(lǐng)域多面手:元宇宙、安全、K
文/楊雪健來(lái)源/節(jié)點(diǎn)財(cái)經(jīng)Meta或迎來(lái)史上最大規(guī)模裁員潮。2026年3月14日,路透社曝出Meta正計(jì)劃啟動(dòng)新一輪大規(guī)模裁員,此次裁員比例或達(dá)公司總員工數(shù)的20%,按其近7.9萬(wàn)的員工規(guī)模計(jì)算,約1.58萬(wàn)名員工或?qū)⒈徊谩H粼撚?jì)劃執(zhí)行,將成為Meta自2022年底實(shí)行“效率之年”重組后規(guī)模最大的一次
3月17日,阿里發(fā)布全球首個(gè)企業(yè)級(jí)AI原生工作平臺(tái)——“悟空”,讓每個(gè)團(tuán)隊(duì)、每家公司,都能擁有一支24h工作的”龍蝦軍團(tuán)”。悟空是一款獨(dú)立應(yīng)用,即日起開(kāi)啟邀測(cè),也將直接內(nèi)置到超2000萬(wàn)企業(yè)組織的釘釘之中。擁有8億用戶的釘釘重寫(xiě)底層代碼,進(jìn)行全面CLI(命令行界面)化改造,讓悟空Agent能夠原生操
AI的“免費(fèi)紅利期”結(jié)束了,未來(lái)18個(gè)月,靠“API倒賣(mài)”的公司,會(huì)成片消失。這個(gè)導(dǎo)火索就是最近Google的一輪封號(hào)導(dǎo)致的,隨著封號(hào)風(fēng)波的結(jié)束,這也標(biāo)志著AI行業(yè)【收租時(shí)代】來(lái)了。2月封號(hào)潮:高付費(fèi)用戶被一鍋端一周前,Google開(kāi)始大規(guī)模封號(hào),付著250美金月費(fèi)的人,賬號(hào)說(shuō)沒(méi)就沒(méi),Gmail、Y
來(lái)自路透社等媒體報(bào)道的最新消息:DeepSeek未發(fā)布的V4Lite模型遭泄露上網(wǎng),華為獲得早期訪問(wèn)權(quán)限,英偉達(dá)被排除在外。近期,谷歌發(fā)表了2篇Multi-Agent協(xié)作學(xué)習(xí)新論文有網(wǎng)友提供了更加詳細(xì)的信息,DeepSeekV4Lite:100萬(wàn)token上下文窗口(V3為128K)內(nèi)置原生多模態(tài)推
春節(jié)紅包會(huì)結(jié)束,但AI已融入數(shù)億人生活里
性能、商業(yè)、生態(tài)詮釋開(kāi)源模型的最佳姿態(tài)
2026年剛開(kāi)年,全世界最狂的那個(gè)男人,穿著他的經(jīng)典黑皮衣,在CES舞臺(tái)上發(fā)出了未來(lái)十年的信號(hào)。他搞了個(gè)“能吃飽套餐”:6個(gè)包子+一碟小菜+一碗粥=肉包子套餐,這樣以后你只要買(mǎi)一個(gè)套餐就能吃飽了。(Rubin平臺(tái))同時(shí)他們店里還免費(fèi)提供的筷子、勺子、蘸料、醬油、醋、水果、零食等等。(開(kāi)放10萬(wàn)億語(yǔ)言
12月12日-14日,2025全球開(kāi)發(fā)者先鋒大會(huì)暨國(guó)際具身智能技能大賽(GDPS2025)于上海張江科學(xué)會(huì)堂舉行,大會(huì)以具身智能競(jìng)技為核心,融合了技術(shù)比拼、產(chǎn)業(yè)展示與科普體驗(yàn),為全球觀眾呈現(xiàn)出具身智能的現(xiàn)在與未來(lái)。上海開(kāi)普勒機(jī)器人有限公司(以下簡(jiǎn)稱"開(kāi)普勒機(jī)器人")攜明星產(chǎn)品K2"大黃蜂"亮相,并參
在數(shù)字化與智能化深度交織的時(shí)代浪潮中,安全的邊界不斷延展,技術(shù)的演進(jìn)正引領(lǐng)產(chǎn)業(yè)邁向新一輪變革。10月24日,以“弈動(dòng)Dynamic·數(shù)智躍遷博弈無(wú)界”為主題的2025TechWorld智慧安全大會(huì)在北京盛大召開(kāi)。來(lái)自國(guó)家部委、院士學(xué)者、高??蒲袡C(jī)構(gòu)和企業(yè)的權(quán)威專(zhuān)家與業(yè)界精英齊聚北京,共議AI安全、數(shù)
2025年10月25日,2025世界青年科學(xué)家峰會(huì)之人工智能(AI)融合創(chuàng)新發(fā)展論壇在浙江溫州成功舉辦。本次論壇由國(guó)際院士科創(chuàng)中心主辦,中國(guó)投資協(xié)會(huì)能源投資專(zhuān)業(yè)委員會(huì)、溫港院士科創(chuàng)中心承辦,中國(guó)電工技術(shù)學(xué)會(huì)、中科先進(jìn)技術(shù)溫州研究院與溫州市電力工程學(xué)會(huì)提供支持,以“甌江論道-AI賦能綠色發(fā)展”為主題,