11月20日,愛數(shù)智慧發(fā)布中文普通話真·萌童聲語(yǔ)音合成(TTS)開源數(shù)據(jù)集。該數(shù)據(jù)集由真童聲錄制,為中文童聲語(yǔ)音合成數(shù)據(jù)集子集,時(shí)長(zhǎng)為15分鐘,文本主要為日常用語(yǔ)。據(jù)了解,數(shù)據(jù)集全集包含2235句話,時(shí)長(zhǎng)超2小時(shí)。這也是該童聲第一次用于TTS錄制。
隨著智能終端市場(chǎng)的擴(kuò)張,人機(jī)交互逐漸成為與智能世界對(duì)話的入口。在人機(jī)互動(dòng)過程中,語(yǔ)音合成(TTS)的自然度和表現(xiàn)力是用戶最能直觀感受到的部分。用戶使用智能設(shè)備的頻率增加,對(duì)合成語(yǔ)音的期望值也不斷提高。
TTS數(shù)據(jù)是影響語(yǔ)音合成效果的重要因素。由于TTS數(shù)據(jù)的采集和標(biāo)注要求嚴(yán)格,因而成品數(shù)據(jù)集較少。從采集環(huán)節(jié)來(lái)看,錄音需要在專業(yè)的錄音棚中進(jìn)行,并嚴(yán)格控制噪聲水平,才能最大限度還原發(fā)音人聲音。錄音過程中還需要有專業(yè)的錄音師和監(jiān)聽人在場(chǎng),便于及時(shí)矯正錄音過程中的錯(cuò)誤。從標(biāo)注環(huán)節(jié)來(lái)看,TTS數(shù)據(jù)標(biāo)注分為4個(gè)層級(jí),包括發(fā)音校對(duì)、韻律層級(jí)、音素邊界切分和分詞詞性。為了充分保留發(fā)音人的語(yǔ)義表達(dá)和發(fā)音習(xí)慣,標(biāo)注準(zhǔn)確率要求一般在99%左右。
智能設(shè)備使用者“低齡化”趨勢(shì)明顯,從而帶動(dòng)了童聲數(shù)據(jù)的需求。受制于兒童識(shí)字水平和配合情況,市面上童聲TTS數(shù)據(jù)庫(kù)數(shù)量較少,且多為成年人模仿。童聲TTS語(yǔ)料庫(kù)呈現(xiàn)出明顯的供需不平衡。
本次愛數(shù)智慧發(fā)布的TTS童聲開源數(shù)據(jù)集采集環(huán)境為符合NC-20標(biāo)準(zhǔn)的錄音間并根據(jù)兒童發(fā)音習(xí)慣對(duì)數(shù)據(jù)進(jìn)行轉(zhuǎn)寫和全鏈條標(biāo)注??紤]到句內(nèi)停頓和句間停頓對(duì)聽感的影響,在音素邊界切分環(huán)節(jié),標(biāo)注人員除了對(duì)聲韻母邊界進(jìn)行切分外,還對(duì)句中靜音段和句首尾進(jìn)行精準(zhǔn)切分。
發(fā)音人是影響TTS數(shù)據(jù)質(zhì)量的重要因素。該數(shù)據(jù)集的發(fā)音人為4歲小朋友妞妞。2019年初,發(fā)音韻律好的妞妞在上百位4-6歲小朋友中脫穎而出。因?yàn)榘l(fā)音韻律好能為用戶帶來(lái)更好的聽感。
在與愛數(shù)智慧工作人員接觸中,我們了解到妞妞性格活潑開朗,喜歡看冰雪奇緣和小馬寶莉。在錄制休息期間,想要看動(dòng)畫片時(shí),就會(huì)黏著工作人員撒嬌。錄制工作已經(jīng)結(jié)束很久,工作人員在提起妞妞時(shí),言語(yǔ)間還是充滿著濃濃的不舍與贊賞。這份由衷的贊賞,也讓我們對(duì)這個(gè)真·萌童聲充滿期待!
為智能世界提供充足的數(shù)據(jù)生產(chǎn)力是這家公司創(chuàng)立的初衷。我們也期待愛數(shù)智慧用更多高質(zhì)量的數(shù)據(jù)解鎖更多應(yīng)用場(chǎng)景,服務(wù)更廣域的客戶。
申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!
在信息技術(shù)持續(xù)革新與市場(chǎng)競(jìng)爭(zhēng)日趨激烈的行業(yè)環(huán)境下,本地生活服務(wù)領(lǐng)域正經(jīng)歷著深刻的智能化轉(zhuǎn)型。這一轉(zhuǎn)型過程不僅涉及技術(shù)層面的升級(jí)迭代,更關(guān)乎服務(wù)模式與行業(yè)生態(tài)的系統(tǒng)性重構(gòu)。閱北科技通過持續(xù)推進(jìn)算法技術(shù)的優(yōu)化與應(yīng)用,在提升服務(wù)精準(zhǔn)度和用戶滿意度方面進(jìn)行了積極探索。閱北的算法系統(tǒng)建立在持續(xù)優(yōu)化的技術(shù)架構(gòu)之
2025年10月17日,上海在人工智能技術(shù)加速演進(jìn)、產(chǎn)業(yè)生態(tài)持續(xù)升級(jí)的關(guān)鍵時(shí)期,由上海市漕河涇新興技術(shù)開發(fā)區(qū)發(fā)展總公司聯(lián)合天罡智算交易平臺(tái)共同發(fā)起成立的“漕河涇天罡人工智能研究院”(以下簡(jiǎn)稱“研究院”)正式揭牌。研究院將依托漕河涇的產(chǎn)業(yè)資源與平臺(tái)優(yōu)勢(shì),聯(lián)合上海交通大學(xué)、上海社會(huì)科學(xué)院等權(quán)威機(jī)構(gòu),聚焦
以“智能時(shí)代同球共濟(jì)”為主題的2025世界人工智能大會(huì)在上海正式開幕。
“AI大模型六小虎”百川智能危機(jī)重重。這是前搜狗CEO王小川創(chuàng)辦的AI公司。昨天就爆出新聞,百川智能的聯(lián)合創(chuàng)始人離職,這是王小川入局AI的第一道大坎。接下的成敗非常關(guān)鍵:(1)拿下河北(2)學(xué)習(xí)科大訊飛百川智能離職高端概覽:(1)2025年7月10日,百川智能技術(shù)聯(lián)合創(chuàng)始人謝劍將離職。他是百川只能的
人工智能作為引領(lǐng)新一輪科技革命和產(chǎn)業(yè)變革的戰(zhàn)略性技術(shù),正在加速融入千行百業(yè),便利千家萬(wàn)戶。
文/楊雪健來(lái)源/節(jié)點(diǎn)財(cái)經(jīng)Meta或迎來(lái)史上最大規(guī)模裁員潮。2026年3月14日,路透社曝出Meta正計(jì)劃啟動(dòng)新一輪大規(guī)模裁員,此次裁員比例或達(dá)公司總員工數(shù)的20%,按其近7.9萬(wàn)的員工規(guī)模計(jì)算,約1.58萬(wàn)名員工或?qū)⒈徊?。若該?jì)劃執(zhí)行,將成為Meta自2022年底實(shí)行“效率之年”重組后規(guī)模最大的一次
3月17日,阿里發(fā)布全球首個(gè)企業(yè)級(jí)AI原生工作平臺(tái)——“悟空”,讓每個(gè)團(tuán)隊(duì)、每家公司,都能擁有一支24h工作的”龍蝦軍團(tuán)”。悟空是一款獨(dú)立應(yīng)用,即日起開啟邀測(cè),也將直接內(nèi)置到超2000萬(wàn)企業(yè)組織的釘釘之中。擁有8億用戶的釘釘重寫底層代碼,進(jìn)行全面CLI(命令行界面)化改造,讓悟空Agent能夠原生操
AI的“免費(fèi)紅利期”結(jié)束了,未來(lái)18個(gè)月,靠“API倒賣”的公司,會(huì)成片消失。這個(gè)導(dǎo)火索就是最近Google的一輪封號(hào)導(dǎo)致的,隨著封號(hào)風(fēng)波的結(jié)束,這也標(biāo)志著AI行業(yè)【收租時(shí)代】來(lái)了。2月封號(hào)潮:高付費(fèi)用戶被一鍋端一周前,Google開始大規(guī)模封號(hào),付著250美金月費(fèi)的人,賬號(hào)說沒就沒,Gmail、Y
來(lái)自路透社等媒體報(bào)道的最新消息:DeepSeek未發(fā)布的V4Lite模型遭泄露上網(wǎng),華為獲得早期訪問權(quán)限,英偉達(dá)被排除在外。近期,谷歌發(fā)表了2篇Multi-Agent協(xié)作學(xué)習(xí)新論文有網(wǎng)友提供了更加詳細(xì)的信息,DeepSeekV4Lite:100萬(wàn)token上下文窗口(V3為128K)內(nèi)置原生多模態(tài)推
春節(jié)紅包會(huì)結(jié)束,但AI已融入數(shù)億人生活里
性能、商業(yè)、生態(tài)詮釋開源模型的最佳姿態(tài)
2026年剛開年,全世界最狂的那個(gè)男人,穿著他的經(jīng)典黑皮衣,在CES舞臺(tái)上發(fā)出了未來(lái)十年的信號(hào)。他搞了個(gè)“能吃飽套餐”:6個(gè)包子+一碟小菜+一碗粥=肉包子套餐,這樣以后你只要買一個(gè)套餐就能吃飽了。(Rubin平臺(tái))同時(shí)他們店里還免費(fèi)提供的筷子、勺子、蘸料、醬油、醋、水果、零食等等。(開放10萬(wàn)億語(yǔ)言
12月12日-14日,2025全球開發(fā)者先鋒大會(huì)暨國(guó)際具身智能技能大賽(GDPS2025)于上海張江科學(xué)會(huì)堂舉行,大會(huì)以具身智能競(jìng)技為核心,融合了技術(shù)比拼、產(chǎn)業(yè)展示與科普體驗(yàn),為全球觀眾呈現(xiàn)出具身智能的現(xiàn)在與未來(lái)。上海開普勒機(jī)器人有限公司(以下簡(jiǎn)稱"開普勒機(jī)器人")攜明星產(chǎn)品K2"大黃蜂"亮相,并參
在數(shù)字化與智能化深度交織的時(shí)代浪潮中,安全的邊界不斷延展,技術(shù)的演進(jìn)正引領(lǐng)產(chǎn)業(yè)邁向新一輪變革。10月24日,以“弈動(dòng)Dynamic·數(shù)智躍遷博弈無(wú)界”為主題的2025TechWorld智慧安全大會(huì)在北京盛大召開。來(lái)自國(guó)家部委、院士學(xué)者、高??蒲袡C(jī)構(gòu)和企業(yè)的權(quán)威專家與業(yè)界精英齊聚北京,共議AI安全、數(shù)
2025年10月25日,2025世界青年科學(xué)家峰會(huì)之人工智能(AI)融合創(chuàng)新發(fā)展論壇在浙江溫州成功舉辦。本次論壇由國(guó)際院士科創(chuàng)中心主辦,中國(guó)投資協(xié)會(huì)能源投資專業(yè)委員會(huì)、溫港院士科創(chuàng)中心承辦,中國(guó)電工技術(shù)學(xué)會(huì)、中科先進(jìn)技術(shù)溫州研究院與溫州市電力工程學(xué)會(huì)提供支持,以“甌江論道-AI賦能綠色發(fā)展”為主題,