11月20日,愛數(shù)智慧發(fā)布中文普通話真·萌童聲語(yǔ)音合成(TTS)開源數(shù)據(jù)集。該數(shù)據(jù)集由真童聲錄制,為中文童聲語(yǔ)音合成數(shù)據(jù)集子集,時(shí)長(zhǎng)為15分鐘,文本主要為日常用語(yǔ)。據(jù)了解,數(shù)據(jù)集全集包含2235句話,時(shí)長(zhǎng)超2小時(shí)。這也是該童聲第一次用于TTS錄制。
隨著智能終端市場(chǎng)的擴(kuò)張,人機(jī)交互逐漸成為與智能世界對(duì)話的入口。在人機(jī)互動(dòng)過(guò)程中,語(yǔ)音合成(TTS)的自然度和表現(xiàn)力是用戶最能直觀感受到的部分。用戶使用智能設(shè)備的頻率增加,對(duì)合成語(yǔ)音的期望值也不斷提高。
TTS數(shù)據(jù)是影響語(yǔ)音合成效果的重要因素。由于TTS數(shù)據(jù)的采集和標(biāo)注要求嚴(yán)格,因而成品數(shù)據(jù)集較少。從采集環(huán)節(jié)來(lái)看,錄音需要在專業(yè)的錄音棚中進(jìn)行,并嚴(yán)格控制噪聲水平,才能最大限度還原發(fā)音人聲音。錄音過(guò)程中還需要有專業(yè)的錄音師和監(jiān)聽人在場(chǎng),便于及時(shí)矯正錄音過(guò)程中的錯(cuò)誤。從標(biāo)注環(huán)節(jié)來(lái)看,TTS數(shù)據(jù)標(biāo)注分為4個(gè)層級(jí),包括發(fā)音校對(duì)、韻律層級(jí)、音素邊界切分和分詞詞性。為了充分保留發(fā)音人的語(yǔ)義表達(dá)和發(fā)音習(xí)慣,標(biāo)注準(zhǔn)確率要求一般在99%左右。
智能設(shè)備使用者“低齡化”趨勢(shì)明顯,從而帶動(dòng)了童聲數(shù)據(jù)的需求。受制于兒童識(shí)字水平和配合情況,市面上童聲TTS數(shù)據(jù)庫(kù)數(shù)量較少,且多為成年人模仿。童聲TTS語(yǔ)料庫(kù)呈現(xiàn)出明顯的供需不平衡。
本次愛數(shù)智慧發(fā)布的TTS童聲開源數(shù)據(jù)集采集環(huán)境為符合NC-20標(biāo)準(zhǔn)的錄音間并根據(jù)兒童發(fā)音習(xí)慣對(duì)數(shù)據(jù)進(jìn)行轉(zhuǎn)寫和全鏈條標(biāo)注??紤]到句內(nèi)停頓和句間停頓對(duì)聽感的影響,在音素邊界切分環(huán)節(jié),標(biāo)注人員除了對(duì)聲韻母邊界進(jìn)行切分外,還對(duì)句中靜音段和句首尾進(jìn)行精準(zhǔn)切分。
發(fā)音人是影響TTS數(shù)據(jù)質(zhì)量的重要因素。該數(shù)據(jù)集的發(fā)音人為4歲小朋友妞妞。2019年初,發(fā)音韻律好的妞妞在上百位4-6歲小朋友中脫穎而出。因?yàn)榘l(fā)音韻律好能為用戶帶來(lái)更好的聽感。
在與愛數(shù)智慧工作人員接觸中,我們了解到妞妞性格活潑開朗,喜歡看冰雪奇緣和小馬寶莉。在錄制休息期間,想要看動(dòng)畫片時(shí),就會(huì)黏著工作人員撒嬌。錄制工作已經(jīng)結(jié)束很久,工作人員在提起妞妞時(shí),言語(yǔ)間還是充滿著濃濃的不舍與贊賞。這份由衷的贊賞,也讓我們對(duì)這個(gè)真·萌童聲充滿期待!
為智能世界提供充足的數(shù)據(jù)生產(chǎn)力是這家公司創(chuàng)立的初衷。我們也期待愛數(shù)智慧用更多高質(zhì)量的數(shù)據(jù)解鎖更多應(yīng)用場(chǎng)景,服務(wù)更廣域的客戶。
申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!
在信息技術(shù)持續(xù)革新與市場(chǎng)競(jìng)爭(zhēng)日趨激烈的行業(yè)環(huán)境下,本地生活服務(wù)領(lǐng)域正經(jīng)歷著深刻的智能化轉(zhuǎn)型。這一轉(zhuǎn)型過(guò)程不僅涉及技術(shù)層面的升級(jí)迭代,更關(guān)乎服務(wù)模式與行業(yè)生態(tài)的系統(tǒng)性重構(gòu)。閱北科技通過(guò)持續(xù)推進(jìn)算法技術(shù)的優(yōu)化與應(yīng)用,在提升服務(wù)精準(zhǔn)度和用戶滿意度方面進(jìn)行了積極探索。閱北的算法系統(tǒng)建立在持續(xù)優(yōu)化的技術(shù)架構(gòu)之
2025年10月17日,上海在人工智能技術(shù)加速演進(jìn)、產(chǎn)業(yè)生態(tài)持續(xù)升級(jí)的關(guān)鍵時(shí)期,由上海市漕河涇新興技術(shù)開發(fā)區(qū)發(fā)展總公司聯(lián)合天罡智算交易平臺(tái)共同發(fā)起成立的“漕河涇天罡人工智能研究院”(以下簡(jiǎn)稱“研究院”)正式揭牌。研究院將依托漕河涇的產(chǎn)業(yè)資源與平臺(tái)優(yōu)勢(shì),聯(lián)合上海交通大學(xué)、上海社會(huì)科學(xué)院等權(quán)威機(jī)構(gòu),聚焦
以“智能時(shí)代同球共濟(jì)”為主題的2025世界人工智能大會(huì)在上海正式開幕。
“AI大模型六小虎”百川智能危機(jī)重重。這是前搜狗CEO王小川創(chuàng)辦的AI公司。昨天就爆出新聞,百川智能的聯(lián)合創(chuàng)始人離職,這是王小川入局AI的第一道大坎。接下的成敗非常關(guān)鍵:(1)拿下河北(2)學(xué)習(xí)科大訊飛百川智能離職高端概覽:(1)2025年7月10日,百川智能技術(shù)聯(lián)合創(chuàng)始人謝劍將離職。他是百川只能的
人工智能作為引領(lǐng)新一輪科技革命和產(chǎn)業(yè)變革的戰(zhàn)略性技術(shù),正在加速融入千行百業(yè),便利千家萬(wàn)戶。
4月2日,字節(jié)跳動(dòng)旗下火山引擎在武漢舉行的AI創(chuàng)新巡展上宣布,Seedance2.0API正式面向企業(yè)用戶開啟公測(cè)。同時(shí),火山引擎總裁譚待在會(huì)上披露,截至今年3月,豆包大模型日均Token使用量已突破120萬(wàn)億,在過(guò)去三個(gè)月內(nèi)增長(zhǎng)一倍,比2024年5月發(fā)布時(shí)增長(zhǎng)1000倍。Seedance2.0:從
養(yǎng)AI小龍蝦的路上,坑不少。有人被代裝服務(wù)騙了錢,有人電腦中了毒,有人收到天價(jià)賬單,還有人發(fā)現(xiàn)AI“失控”了,開始亂刪文件。如果你也遇到這些糟心事,別慌。下面這份“養(yǎng)蝦應(yīng)急包”,告訴你第一時(shí)間該做什么。場(chǎng)景一:代裝被騙,錢打水漂了花了300塊找人遠(yuǎn)程裝OpenClaw,結(jié)果對(duì)方收了錢就拉黑,或者裝了
把AI智能體請(qǐng)進(jìn)電腦,就像把家里所有的鑰匙交給了一個(gè)陌生人。它能幫你打掃房間、整理文件,但萬(wàn)一它“起了壞心”,或者被壞人利用了,你的家就不再安全了。這不是危言聳聽。國(guó)家互聯(lián)網(wǎng)應(yīng)急中心已經(jīng)發(fā)布風(fēng)險(xiǎn)提示,指出OpenClaw的默認(rèn)配置“極為脆弱”,攻擊者一旦得手,能輕易獲取系統(tǒng)控制權(quán)。微軟安全團(tuán)隊(duì)也警告
OpenClaw火了,火到似乎人人都在討論“養(yǎng)蝦”。打開社交媒體,滿屏都是“有了AI小龍蝦,我再也不用加班了”“我讓AI幫我訂了機(jī)票、寫周報(bào)、點(diǎn)外賣”之類的分享。于是,很多人開始焦慮:別人都養(yǎng)了,我要不要也養(yǎng)一只?不養(yǎng)是不是就落伍了?先別急。在決定養(yǎng)“蝦”之前,我們先冷靜下來(lái),想清楚一個(gè)問(wèn)題:你到底
3月31日,科技圈上演了一場(chǎng)現(xiàn)實(shí)版的“代碼大逃殺”。一向以“閉源”為傲的AI巨頭Anthropic,因一個(gè)低級(jí)打包失誤,將旗下明星產(chǎn)品ClaudeCode的完整源代碼拱手送給了全世界。一次59.8MB的“裸奔”事情始于一個(gè)普通的周二早晨。Web3安全公司FuzzLab的實(shí)習(xí)研究員ChaofanSho
當(dāng)?shù)貢r(shí)間3月31日,人工智能明星公司OpenAI宣布完成一輪規(guī)模達(dá)1220億美元的私募融資,投后估值攀升至8520億美元,創(chuàng)下全球AI企業(yè)估值新紀(jì)錄,同時(shí)也刷新了科技行業(yè)私募融資的歷史最高規(guī)模。本輪融資籌備歷時(shí)數(shù)月,核心資金來(lái)自三家頭部科技企業(yè):亞馬遜承諾投資500億美元,英偉達(dá)與軟銀集團(tuán)分別出資3
“我也想養(yǎng)一只AI小龍蝦,但聽說(shuō)安裝特別難,我連代碼都不會(huì)寫,怎么辦?”這是最近后臺(tái)收到最多的私信。面對(duì)OpenClaw這個(gè)技術(shù)門檻不低的AI智能體,很多普通人躍躍欲試,卻又望而卻步。于是,一個(gè)“代裝”產(chǎn)業(yè)應(yīng)運(yùn)而生——遠(yuǎn)程50到300元,上門500到1500元,幫你搞定一切。但問(wèn)題是:這些代裝服務(wù)靠
最近,身邊不少人都在討論“養(yǎng)AI小龍蝦”。這只叫OpenClaw的智能體,能替你自動(dòng)訂機(jī)票、寫代碼、整理文件,聽起來(lái)像請(qǐng)了一個(gè)24小時(shí)不休息的數(shù)字員工。但問(wèn)題來(lái)了——月薪五千的普通人,養(yǎng)得起嗎?我們先算一筆賬。養(yǎng)這只“蝦”,主要有三個(gè)花錢的地方。第一筆:硬件投入。OpenClaw創(chuàng)始人推薦用MacM
最近,“養(yǎng)AI小龍蝦”成了互聯(lián)網(wǎng)上的一股熱潮。這里的“小龍蝦”指的是OpenClaw——一個(gè)能替你自動(dòng)做事的人工智能體。訂機(jī)票、寫代碼、整理文件,它就像一個(gè)24小時(shí)不休息的數(shù)字員工。聽起來(lái)很酷,但很多人忽略了一個(gè)關(guān)鍵問(wèn)題:這只“蝦”需要你電腦的完整訪問(wèn)權(quán)限。也就是說(shuō),一旦你把它“請(qǐng)”進(jìn)家門,它就能看
最近,互聯(lián)網(wǎng)上刮起了一股“養(yǎng)蝦熱”。這個(gè)“蝦”不是餐桌上的小龍蝦,而是一個(gè)叫OpenClaw的AI智能體。標(biāo)志是一只紅色小龍蝦,寓意不斷蛻殼成長(zhǎng)。OpenClaw到底是個(gè)什么東西?簡(jiǎn)單說(shuō),它是一個(gè)開源的AI智能體框架,能裝進(jìn)你的電腦,替你自動(dòng)做事——訂機(jī)票、寫代碼、整理文件,就像一個(gè)24小時(shí)不休息的