1. 創(chuàng)業(yè)頭條
  2. 前沿領(lǐng)域
  3. 人工智能
  4. 正文

愛數(shù)智慧發(fā)布中文普通話真·萌童聲TTS開源數(shù)據(jù)集

 2019-11-26 14:41  來源:互聯(lián)網(wǎng)  我來投稿 撤稿糾錯

  阿里云優(yōu)惠券 先領(lǐng)券再下單

11月20日,愛數(shù)智慧發(fā)布中文普通話真·萌童聲語音合成(TTS)開源數(shù)據(jù)集。該數(shù)據(jù)集由真童聲錄制,為中文童聲語音合成數(shù)據(jù)集子集,時長為15分鐘,文本主要為日常用語。據(jù)了解,數(shù)據(jù)集全集包含2235句話,時長超2小時。這也是該童聲第一次用于TTS錄制。

隨著智能終端市場的擴(kuò)張,人機(jī)交互逐漸成為與智能世界對話的入口。在人機(jī)互動過程中,語音合成(TTS)的自然度和表現(xiàn)力是用戶最能直觀感受到的部分。用戶使用智能設(shè)備的頻率增加,對合成語音的期望值也不斷提高。

TTS數(shù)據(jù)是影響語音合成效果的重要因素。由于TTS數(shù)據(jù)的采集和標(biāo)注要求嚴(yán)格,因而成品數(shù)據(jù)集較少。從采集環(huán)節(jié)來看,錄音需要在專業(yè)的錄音棚中進(jìn)行,并嚴(yán)格控制噪聲水平,才能最大限度還原發(fā)音人聲音。錄音過程中還需要有專業(yè)的錄音師和監(jiān)聽人在場,便于及時矯正錄音過程中的錯誤。從標(biāo)注環(huán)節(jié)來看,TTS數(shù)據(jù)標(biāo)注分為4個層級,包括發(fā)音校對、韻律層級、音素邊界切分和分詞詞性。為了充分保留發(fā)音人的語義表達(dá)和發(fā)音習(xí)慣,標(biāo)注準(zhǔn)確率要求一般在99%左右。

智能設(shè)備使用者“低齡化”趨勢明顯,從而帶動了童聲數(shù)據(jù)的需求。受制于兒童識字水平和配合情況,市面上童聲TTS數(shù)據(jù)庫數(shù)量較少,且多為成年人模仿。童聲TTS語料庫呈現(xiàn)出明顯的供需不平衡。

本次愛數(shù)智慧發(fā)布的TTS童聲開源數(shù)據(jù)集采集環(huán)境為符合NC-20標(biāo)準(zhǔn)的錄音間并根據(jù)兒童發(fā)音習(xí)慣對數(shù)據(jù)進(jìn)行轉(zhuǎn)寫和全鏈條標(biāo)注??紤]到句內(nèi)停頓和句間停頓對聽感的影響,在音素邊界切分環(huán)節(jié),標(biāo)注人員除了對聲韻母邊界進(jìn)行切分外,還對句中靜音段和句首尾進(jìn)行精準(zhǔn)切分。

發(fā)音人是影響TTS數(shù)據(jù)質(zhì)量的重要因素。該數(shù)據(jù)集的發(fā)音人為4歲小朋友妞妞。2019年初,發(fā)音韻律好的妞妞在上百位4-6歲小朋友中脫穎而出。因?yàn)榘l(fā)音韻律好能為用戶帶來更好的聽感。

在與愛數(shù)智慧工作人員接觸中,我們了解到妞妞性格活潑開朗,喜歡看冰雪奇緣和小馬寶莉。在錄制休息期間,想要看動畫片時,就會黏著工作人員撒嬌。錄制工作已經(jīng)結(jié)束很久,工作人員在提起妞妞時,言語間還是充滿著濃濃的不舍與贊賞。這份由衷的贊賞,也讓我們對這個真·萌童聲充滿期待!

為智能世界提供充足的數(shù)據(jù)生產(chǎn)力是這家公司創(chuàng)立的初衷。我們也期待愛數(shù)智慧用更多高質(zhì)量的數(shù)據(jù)解鎖更多應(yīng)用場景,服務(wù)更廣域的客戶。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)標(biāo)簽
人工智能
智慧生活

相關(guān)文章

  • IoT開發(fā)者為王,涂鴉智能硬核“靠邊站”

    IoT盛宴:涂鴉向下,產(chǎn)品向上

    標(biāo)簽:
    人工智能
  • IPO觀察丨黑芝麻智能遞表港交所,車芯行業(yè)已邁向量產(chǎn)決戰(zhàn)期?

    雖然我國汽車芯片行業(yè)還處在發(fā)展初期,但已經(jīng)迸發(fā)出無限潛力。一方面,智能汽車的發(fā)展不斷帶動需求增長;另一方面,政策引導(dǎo)下,汽車芯片企業(yè)持續(xù)搶占高地。對此,在7月5日-7日舉辦的2023年中國汽車論壇上,中國汽車工業(yè)協(xié)會副秘書長李邵華就做出表示,“中國將成為未來汽車芯片發(fā)展的集聚地”。車規(guī)芯片行業(yè)近日的

    標(biāo)簽:
    人工智能
  • 倒計時2天丨云天勵飛將亮相世界人工智能大會

    2023世界人工智能大會將于7月6日至8日在上海舉辦。云天勵飛將在大會上展示自主設(shè)計開發(fā)的新一代邊緣計算芯片DeepEdge10系列SoC芯片,并公布“天書”大模型的最新動態(tài)。歡迎蒞臨上海世博展覽館H1-C801展臺參觀交流!同時,云天勵飛也將與中國電子、中國信通院、華為等合作伙伴,在WAIC的舞臺

    標(biāo)簽:
    人工智能
  • 首屆中國智慧生活大會(CIC)在京成功召開

    6月28日,首屆中國智慧生活大會(CIC)在北京成功召開。本次大會是對貫徹擴(kuò)大內(nèi)需政策,落實(shí)國務(wù)院“三品戰(zhàn)略”,結(jié)合“2023消費(fèi)提振年”工作安排的積極響應(yīng)。會議由中國電子視像行業(yè)協(xié)會、中國標(biāo)準(zhǔn)科技集團(tuán)、中家院(北京)檢測認(rèn)證有限公司聯(lián)合指導(dǎo),洛圖科技(RUNTO)主辦,京東3C數(shù)碼和植理文化協(xié)辦。

    標(biāo)簽:
    智慧生活
  • 酷學(xué)院智能產(chǎn)品發(fā)布會:引領(lǐng)中大型企業(yè)學(xué)習(xí)新潮流

    近日,酷學(xué)院智能產(chǎn)品發(fā)布會在深圳閃亮登場。近200位現(xiàn)場觀眾和近萬人次在線觀看,共同見證了這一激動人心的時刻。發(fā)布會上,酷學(xué)院引領(lǐng)大家探索企業(yè)培訓(xùn)學(xué)習(xí)和人才發(fā)展領(lǐng)域的新高度,并揭幕其全新的產(chǎn)品智能升級和突破??釋W(xué)院產(chǎn)品負(fù)責(zé)人徐晨通過形象生動、邏輯嚴(yán)謹(jǐn)?shù)闹v述,揭曉了全新的智能企業(yè)培訓(xùn)和人才發(fā)展平臺,以

    標(biāo)簽:
    人工智能
  • 全球AI巨頭正在賭:誰搞定MCP,誰就是未來老大

    我不是危言聳聽,現(xiàn)在全球的AI巨頭都在做MCP,毫不夸張的說:誰能把MCP做起來,誰就擁有AI生態(tài)控制權(quán),誰就是AI圈的老大。你們有沒有發(fā)現(xiàn),MCP在2025年初開始特別火爆,互聯(lián)網(wǎng)技術(shù)大廠都在強(qiáng)推MCP。(1)阿里云百煉搞了個MCP平臺,提供50+預(yù)置MCP服務(wù)。不過大都只面向阿里系產(chǎn)品。(2)騰

    標(biāo)簽:
    ai智能
  • 對話李軍:人工智能是“第五范式革命”

    2025國際人工智能程序設(shè)計精英挑戰(zhàn)賽(IAEPC)在香港中文大學(xué)成功舉辦。作為主辦方之一,歐美同學(xué)基金會理事長李軍接受了大賽主持人艾誠采訪。在采訪中,李軍認(rèn)為IAEPC不僅是一場“冠軍中的冠軍”對決,更是一次全球AI人才的線下交流盛會。大賽“史無前例”的吸引了全球青年科技精英匯聚香港,更加推動和普

  • 對話施韓原與杜瑜皓:與參賽選手一起改變世界

    2025國際人工智能程序設(shè)計精英挑戰(zhàn)賽(IAEPC)在香港中文大學(xué)成功舉辦。作為大賽發(fā)起人方之一及裁判委員會負(fù)責(zé)人,施韓原與杜瑜皓接受了大賽主持人艾誠采訪。裁判委員會主席施韓原分享了此次大賽的亮點(diǎn),IAEPC首次引入創(chuàng)新賽道,探索選手如何與AI合作進(jìn)行答題。裁判委員會副主席杜瑜皓認(rèn)為,選手最終目標(biāo)并

  • 吳林林專訪IAEPC冠軍:與全球參賽者交流是最重要的一課

    2025國際人工智能程序設(shè)計精英挑戰(zhàn)賽(IAEPC)在香港中文大學(xué)成功舉辦。來自深圳的學(xué)生吳林林作為主辦方記者團(tuán)成員,采訪了大賽冠軍選手之一。在吳林林的采訪中,選手認(rèn)為與來自全球的參賽者交流是自己學(xué)到的最重要的一課。在科技與AI之前,選手們可以平等、開放、友好的交流。以下是采訪實(shí)錄(有刪節(jié)):吳林林

  • 吳林林專訪黃錦輝:年輕人要像懂中文一樣懂A

    2025國際人工智能程序設(shè)計精英挑戰(zhàn)賽(IAEPC)在香港中文大學(xué)成功舉辦。來自深圳的學(xué)生吳林林作為主辦方記者團(tuán)成員,采訪了大會嘉賓:全國政協(xié)委員、香港特別行政區(qū)立法會議員、香港中文大學(xué)工程學(xué)院副院長、IAEPC聯(lián)合發(fā)起人黃錦輝先生。在吳林林的采訪中,黃錦輝教授勉勵年輕人要像懂中文和英語一樣懂AI,

  • 本以為DeepSeek天下無敵了,沒想到Manus更猛

    昨天新出了一個AI,據(jù)說比DeepSeek還牛,而截止到今早,已經(jīng)有10萬人在排隊申請Manus邀請碼了,而且它邀請碼已經(jīng)炒到10萬了。這是北京的一家人工智能公司蝴蝶科技,創(chuàng)始人是一名來自華中科技大學(xué)的90后畢業(yè)生肖弘,突然向全球宣布:世界上第一款真正的人工智能、通用智能體產(chǎn)品出現(xiàn)了,名叫Manus

    標(biāo)簽:
    ai智能
  • 別讓DeepSeek成了造謠者的“白手套”

    謠言肆虐,擦亮眼睛

  • 庫克已納投名狀:蘋果AI沒得選,只能選百度

    蘋果16弄了兩個版本,一個是專門給中國人用的,準(zhǔn)備用百度的AI,還要交錢。第二個是全世界都可以用的,用了ChatGPT,包括臺灣、香港、澳門都可以用。以后都這樣了。好,問題就出在這,蘋果和百度的合作出現(xiàn)問題了,新聞連起來看,才能明白其中含義。新聞一:蘋果正在和騰訊、字節(jié)初步接洽,考慮將二者的AI模型

    標(biāo)簽:
    蘋果AI
    百度AI
    庫克
  • AI加速時代的“進(jìn)度條”,我們撥動了百分之幾?

    “技術(shù)日新月異,人類生活方式正在快速轉(zhuǎn)變,這一切給人類歷史帶來了一系列不可思議的奇點(diǎn)。我們曾經(jīng)熟悉的一切,都開始變得陌生。”計算機(jī)之父約翰·馮·諾依曼曾這樣說到。

    標(biāo)簽:
    ai智能
  • AI視頻賽道,要變天了

    “毀滅你,與你何干?”,這是在劉慈欣的科幻小說《三體》里用來形容人類與三體人之間的戰(zhàn)爭的一句話。

    標(biāo)簽:
    ai智能