遠(yuǎn)傳科技“數(shù)字主持人”誕生記：不是復(fù)制，而是創(chuàng)造一個(gè)新模態(tài)

2021-05-31 14:27 來源：互聯(lián)網(wǎng) 我來投稿撤稿糾錯(cuò)

遠(yuǎn)傳科技從未停止“造人”的腳步。

除了有“AI虛擬主播”之外，現(xiàn)在連“數(shù)字主持人”也來了，“數(shù)字主持人”到底是什么呢?

遠(yuǎn)傳科技的“數(shù)字主持人”是通過語音合成、唇形合成、表情合成以及深度學(xué)習(xí)等技術(shù)，克隆出具備和真人主播一樣播報(bào)能力的數(shù)字人。通過語音合成技術(shù)和視頻驅(qū)動技術(shù)，只需要輸入一段文本，它就能在屏幕展現(xiàn)虛擬數(shù)字人形象并進(jìn)行新聞播報(bào)，且唇形動作能與播報(bào)聲音實(shí)時(shí)同步。

或許在不久的未來，你再也分不清視頻中的主持人，究竟是真人還是虛擬人，而這一天正在到來。

一、根源探究：「高逼真」的背后

遠(yuǎn)傳科技“數(shù)字主持人”以真人為原型，通過將真人形象數(shù)字化掃描技術(shù)，建立超寫實(shí) 3D 數(shù)字人建模，多模態(tài)識別及生成、實(shí)時(shí)面部動作生成及驅(qū)動、遷移學(xué)習(xí)等技術(shù)「熔爐」，煉就而成。

從效果上來說，3D AI 合成主播給人的最大印象便是高逼真，它較好的還原了真人的發(fā)膚、表情;同時(shí)，靈活性、可塑性更強(qiáng)，擁有的豐富的面部表情動作，嘴部唇動，以及身體的輕微擺動，具備在更廣闊空間使用的潛力。

透過 3D AI 合成主播技術(shù)實(shí)現(xiàn)過程，我們探究它為何擁有如此逼真的效果。

1.數(shù)字化掃描技術(shù)還原真人形象

建立人物模型必須要有海量數(shù)據(jù)，遠(yuǎn)傳科技數(shù)字化掃描技術(shù)通過攝像頭對真人原型的身體各個(gè)部位進(jìn)行全方位「打點(diǎn)」掃描，采集每一處細(xì)節(jié)，并對其多種形態(tài)的面部表情動作，嘴部唇動，以及身體的輕微擺動進(jìn)行細(xì)致入微地捕捉記錄，還原真人形象。

2.深度學(xué)習(xí)算法生成3D數(shù)字人模型

遠(yuǎn)傳科技算法工程師熟練應(yīng)用深度學(xué)習(xí)算法，對算法里的大量參數(shù)進(jìn)行調(diào)優(yōu)，確保生成的3D數(shù)字人模型能夠精確的還原真人在正常說話時(shí)候的唇部動作，臉部表情及微動作，對3D數(shù)字人模型進(jìn)行實(shí)時(shí)驅(qū)動、渲染，使其面部肌肉驅(qū)動、表情肢體和語言表達(dá)能力達(dá)到一個(gè)較高的度契合。確保非專業(yè)人士無法分辨出是真人拍攝的視頻還是通過數(shù)字技術(shù)合成出來的視頻。

二、核心亮點(diǎn)： AI 驅(qū)動、多模態(tài)交互

1.AI 驅(qū)動的 3D 數(shù)字人

遠(yuǎn)傳科技“數(shù)字主持人”是一種由AI所驅(qū)動的虛擬存在，擁有和真人一致的音容、笑貌和言談舉止，擁有表達(dá)情感和智慧的能力。仔細(xì)觀察你會發(fā)現(xiàn)， 3D AI 合成主播是基于 AI 算法實(shí)現(xiàn)驅(qū)動。

具體來說，3D “數(shù)字主持人”靠 AI 算法實(shí)時(shí)驅(qū)動，輸入一個(gè)文本就能輸出一個(gè)視頻，往往生成一個(gè) 1 分鐘的視頻，僅只需要 1 分鐘，幾乎可以看作實(shí)時(shí)生成。

2.關(guān)鍵技術(shù)賦能多模態(tài)交互創(chuàng)新

唇動算法、3D建模技術(shù)、深度學(xué)習(xí)算法、5G通信等關(guān)鍵技術(shù)探索文本、語音和視覺多模態(tài)交互創(chuàng)新的無限可能。

遠(yuǎn)傳科技利用唇動算法分析出數(shù)字人應(yīng)顯示的口型標(biāo)記，突破語言交流過程的表情和唇動的無縫鏈接;根據(jù)給定人物形象要求，建立數(shù)字人3D模型，綁定骨骼，創(chuàng)立動作動畫和口型動畫;基于深度學(xué)習(xí)算法、肢體捕捉技術(shù)，將文本、音頻和圖片實(shí)時(shí)生成數(shù)字人視頻;5G通信技術(shù)則讓用戶跟數(shù)字人進(jìn)行語音視頻互動成為可能，麥克風(fēng)和攝像頭捕捉用戶的語音和動作，數(shù)字人的后端人工智能算法根據(jù)場景生成對應(yīng)的數(shù)字人交互動作、表情和語音。

三、未來已來，你準(zhǔn)備好了嗎？

遠(yuǎn)傳科技“數(shù)字主持人”雖然基于真實(shí)的人進(jìn)行建模，但呈現(xiàn)在人們面前的行為都是完全逼真的，能像真實(shí)主播一樣，去笑，去哭，去表達(dá)，是被創(chuàng)造出來的一個(gè)“數(shù)字人”。

數(shù)字人的未來將會作為主體人的一個(gè)副本形式存在于數(shù)字世界中，在未來的數(shù)字世界中我們將無法分辨出真人和數(shù)字人，大量在數(shù)字世界的服務(wù)將都會由數(shù)字人來代替，在電話客戶服務(wù)、線上產(chǎn)品講解、電商直播甚至線上演唱會等眾多場景都將會有數(shù)字人的角色參與，數(shù)字化終極未來也許就是數(shù)字人的世界。

你準(zhǔn)備好接受一個(gè)數(shù)字世界了嗎?

申請創(chuàng)業(yè)報(bào)道，分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處，共同探討創(chuàng)業(yè)新機(jī)遇！

相關(guān)標(biāo)簽: vr虛擬現(xiàn)實(shí); 數(shù)字技術(shù)

相關(guān)文章

Vision Pro量產(chǎn)背后，虛擬現(xiàn)實(shí)產(chǎn)業(yè)拐點(diǎn)已至？

隨著VisionPro量產(chǎn)時(shí)間的臨近，VR概念再次映入人們的視野，業(yè)內(nèi)“炒作VR”的浪潮，似乎也有了重新抬頭的跡象。

標(biāo)簽：

vr虛擬現(xiàn)實(shí)
蘋果籌備Vision Pro“平替版”，3D數(shù)字化領(lǐng)域積木易搭奔赴VR/AR“綠洲”建設(shè)

繼VisionPro之后，蘋果正在籌備VisionPro的“平替版”6月初，蘋果公司發(fā)布了其第一代MR頭顯——VisionPro，產(chǎn)品一經(jīng)發(fā)布，便在科技圈引起熱議。甚至庫克本人在發(fā)布會上表示：“就像Mac讓我們接觸到個(gè)人電腦，iPhone讓我們接觸到移動計(jì)算一樣，VisionPro將向我們介紹空間計(jì)

標(biāo)簽：

vr虛擬現(xiàn)實(shí)
PingPong福貿(mào)一站式外貿(mào)收款，以數(shù)字技術(shù)促進(jìn)全球收款服務(wù)極致化

全球數(shù)字貿(mào)易迅猛發(fā)展下，第三方外貿(mào)支付機(jī)構(gòu)的角色已經(jīng)從支付服務(wù)進(jìn)化為數(shù)字化綜合服務(wù)，在資金流通、守護(hù)資金安全等方面也根據(jù)廣大企業(yè)時(shí)代背景下的新需求需要承擔(dān)更多的職責(zé)。同時(shí)，隨著大數(shù)據(jù)、人工智能等數(shù)字技術(shù)對貿(mào)易各經(jīng)濟(jì)領(lǐng)域的滲透，對于外貿(mào)支付來說，這也意味著能整合和發(fā)揮自身天然的數(shù)字化能力和資源優(yōu)勢將成

標(biāo)簽：

數(shù)字技術(shù)
空間計(jì)算時(shí)代下，中國能否誕生下一個(gè)“蘋果”？

空間計(jì)算時(shí)代拉開序幕。

標(biāo)簽：

vr虛擬現(xiàn)實(shí)
沉浸式教育看點(diǎn)十足，大朋VR多款產(chǎn)品亮相“中國教育裝備展示會”

第81屆中國教育裝備展示會于4月21日-23日在江西南昌綠地國際博覽中心如期舉辦。展會上，大朋VR旗下產(chǎn)品在包括萌科科技、東湃科技、矩道網(wǎng)絡(luò)在內(nèi)的多家教育培訓(xùn)內(nèi)容商聯(lián)合展區(qū)之中頻頻亮相，展示內(nèi)容囊括元宇宙教育、消防安全教育、K12現(xiàn)代化教育等諸多領(lǐng)域，吸引了眾多關(guān)注。教育領(lǐng)域多面手：元宇宙、安全、K

標(biāo)簽：

vr虛擬現(xiàn)實(shí)

養(yǎng)openclaw小龍蝦，每月要花多少錢才能養(yǎng)好？

“養(yǎng)龍蝦”到底要花多少錢？這個(gè)問題可能是大家最關(guān)心的。我們把成本拆成三部分：服務(wù)器租用費(fèi)+大模型API調(diào)用費(fèi)+雜項(xiàng)開銷。第一部分：服務(wù)器租用費(fèi)。最省錢的方案當(dāng)然是本地舊電腦自托管——零新增成本，電費(fèi)忽略不計(jì)。但如前所述，你需要接受“不是7×24小時(shí)在線”的局限性。如果選擇云服務(wù)器，成本差異就很大了。

標(biāo)簽：

openclaw小龍蝦

ai龍蝦是什么

ai小龍蝦什么意思
養(yǎng)小龍蝦用個(gè)人電腦還是云服務(wù)器？先搞清楚OpenClaw到底是什么

不少朋友第一次接觸OpenClaw時(shí)，都會有一個(gè)相同的困惑：這玩意兒到底該裝在哪里？OpenClaw（社區(qū)戲稱“養(yǎng)龍蝦”，因Logo為龍蝦鉗）不是普通的聊天機(jī)器人，而是一款本地優(yōu)先、可自主執(zhí)行、支持多Agent分工協(xié)作的AI執(zhí)行網(wǎng)關(guān)。說白了，它讓大模型從“只會說話”變成“會動手做事”——幫你管理文件

標(biāo)簽：

ai龍蝦是什么

ai小龍蝦什么意思

openclaw小龍蝦
AI龍蝦養(yǎng)了這么久，這8個(gè)建議你一定要聽

01別相信“一鍵養(yǎng)蝦，躺平賺錢”的鬼話打開社交媒體，你可能會看到這樣的標(biāo)題：“養(yǎng)只龍蝦自動炒股，零代碼養(yǎng)出數(shù)字巴菲特！”信了，你就輸了。真實(shí)情況是：一個(gè)做跨境電商的小哥花了200元租服務(wù)器、訂閱API，指望龍蝦幫他炒股暴富。結(jié)果龍蝦開始幾天還像模像樣，后來直接擺爛，生成個(gè)干癟的大綱就敷衍了事。AI是

標(biāo)簽：

ai龍蝦是什么

ai小龍蝦什么意思

openclaw小龍蝦
“養(yǎng)龍蝦”火了，可你養(yǎng)的“蝦”要是闖了禍，責(zé)任到底算誰的？

一張證書引發(fā)的討論4月7日，北京嫣然天使兒童醫(yī)院給陳光標(biāo)發(fā)了一張感謝證書，感謝他捐贈1000萬元。這事說起來挺曲折的。此前陳光標(biāo)高調(diào)說要贈給張雪一臺價(jià)值1300萬元的勞斯萊斯，張雪回應(yīng)“收了，八折賣掉捐給嫣然”，一番拉扯之后，陳光標(biāo)把車變現(xiàn)，1000萬元直接打到了嫣然醫(yī)院賬上。醫(yī)院發(fā)證書感謝，本來是

標(biāo)簽：

ai龍蝦是什么

ai小龍蝦什么意思

openclaw小龍蝦
國家安全部發(fā)布Token安全警示：需高度警惕數(shù)據(jù)泄露與金融詐騙風(fēng)險(xiǎn)

2026年4月7日，國家安全部就AI核心術(shù)語“詞元”（Token）發(fā)布安全警示，強(qiáng)調(diào)在日均調(diào)用量突破140萬億規(guī)模的市場背景下，需高度警惕由此引發(fā)的數(shù)據(jù)泄露與金融詐騙風(fēng)險(xiǎn)。據(jù)統(tǒng)計(jì)，截至今年3月，我國日均詞元調(diào)用量已超過140萬億，較2024年初增長1000多倍。詞元作為大模型處理信息的最小單元，兼具
中國AI大模型連續(xù)五周領(lǐng)跑全球，調(diào)用量大幅增長

如今出門，如果你還沒用過AI智能助手，可能真有點(diǎn)跟不上節(jié)奏了。無論是寫作文、查資料，還是規(guī)劃出行路線，越來越多的人已經(jīng)習(xí)慣隨手打開AI問一句。這股熱潮背后，中國AI大模型用實(shí)打?qū)嵉臄?shù)據(jù)交出了一份亮眼的成績單。根據(jù)全球知名AI模型聚合平臺OpenRouter的最新數(shù)據(jù)，在3月30日至4月5日這一周，中

標(biāo)簽：

大模型

小白養(yǎng)龍蝦的5條保命建議，值得收藏！

01別在主電腦上養(yǎng)！這是最最重要的一條“保命”建議。很多小白心血來潮，直接在自己存著畢業(yè)論文、工作文件、銀行卡信息的主力電腦上部署OpenClaw。然后悲劇發(fā)生了：讓龍蝦幫忙整理一下桌面文件，結(jié)果它把整臺電腦的文件全刪了。這不是段子，是真事。OpenClaw一旦被授予高權(quán)限，就能執(zhí)行刪除、修改等不可

標(biāo)簽：

ai龍蝦是什么

ai小龍蝦什么意思

openclaw小龍蝦
養(yǎng)一只OpenClaw小龍蝦1個(gè)月到底要花多少錢，快來算一算適不適合你？

01免費(fèi)領(lǐng)養(yǎng)，但飼料要錢很多人第一次聽說OpenClaw時(shí)，腦子里冒出的第一個(gè)念頭是：開源軟件，那不免費(fèi)嗎？沒錯(cuò)，OpenClaw本身確實(shí)是開源的，下載安裝一分錢不收。但你很快就會發(fā)現(xiàn)，真正的開銷根本不在這里。養(yǎng)一只“龍蝦”，就像領(lǐng)養(yǎng)了一只寵物——領(lǐng)養(yǎng)免費(fèi)，但“蝦缸”“蝦糧”“蝦保姆”都得自己掏錢。

標(biāo)簽：

ai龍蝦是什么

ai小龍蝦什么意思

openclaw小龍蝦
“養(yǎng)龍蝦”為什么突然火了？OpenClaw很強(qiáng)，但普通人真的適合嗎？

一只“龍蝦”，火遍全網(wǎng)“今天你養(yǎng)龍蝦了嗎？”這句話在2026年初，迅速取代“吃了嗎”成為社交媒體上的新晉暗號。別誤會，這不是什么水產(chǎn)養(yǎng)殖新風(fēng)口。這里說的“龍蝦”，是一款名為OpenClaw的開源AI智能體。因?yàn)樗膱D標(biāo)是一只紅色龍蝦，網(wǎng)友們便把部署、配置和使用它的過程，戲稱為“養(yǎng)龍蝦”。一個(gè)開源軟件

標(biāo)簽：

ai龍蝦是什么

ai小龍蝦什么意思

openclaw小龍蝦
一秒當(dāng)導(dǎo)演：小云雀上線短劇Agent，10萬字劇本一鍵生成60集

凌晨兩點(diǎn)，小王合上筆記本，揉了揉酸脹的眼睛。花了一個(gè)月寫出來的10萬字短劇劇本躺在硬盤里，要真正把它拍成劇，得找演員、租場地、請攝像、做后期……粗算下來少說要幾十萬，他只能把劇本繼續(xù)鎖在抽屜里。不過，現(xiàn)在小王的劇本可以“見光”了。2026年3月19日，字節(jié)跳動旗下的小云雀AI正式上線了短劇Agent

標(biāo)簽：

大模型

加載更多

遠(yuǎn)傳科技“數(shù)字主持人”誕生記：不是復(fù)制，而是創(chuàng)造一個(gè)新模態(tài)

相關(guān)文章

Vision Pro量產(chǎn)背后，虛擬現(xiàn)實(shí)產(chǎn)業(yè)拐點(diǎn)已至？

蘋果籌備Vision Pro“平替版”，3D數(shù)字化領(lǐng)域積木易搭奔赴VR/AR“綠洲”建設(shè)

PingPong福貿(mào)一站式外貿(mào)收款，以數(shù)字技術(shù)促進(jìn)全球收款服務(wù)極致化

空間計(jì)算時(shí)代下，中國能否誕生下一個(gè)“蘋果”？

沉浸式教育看點(diǎn)十足，大朋VR多款產(chǎn)品亮相“中國教育裝備展示會”

養(yǎng)openclaw小龍蝦，每月要花多少錢才能養(yǎng)好？

養(yǎng)小龍蝦用個(gè)人電腦還是云服務(wù)器？先搞清楚OpenClaw到底是什么

AI龍蝦養(yǎng)了這么久，這8個(gè)建議你一定要聽

“養(yǎng)龍蝦”火了，可你養(yǎng)的“蝦”要是闖了禍，責(zé)任到底算誰的？

國家安全部發(fā)布Token安全警示：需高度警惕數(shù)據(jù)泄露與金融詐騙風(fēng)險(xiǎn)

中國AI大模型連續(xù)五周領(lǐng)跑全球，調(diào)用量大幅增長

小白養(yǎng)龍蝦的5條保命建議，值得收藏！

養(yǎng)一只OpenClaw小龍蝦1個(gè)月到底要花多少錢，快來算一算適不適合你？

“養(yǎng)龍蝦”為什么突然火了？OpenClaw很強(qiáng)，但普通人真的適合嗎？

一秒當(dāng)導(dǎo)演：小云雀上線短劇Agent，10萬字劇本一鍵生成60集

熱門排行

編輯推薦