1. 創(chuàng)業(yè)頭條
  2. 前沿領(lǐng)域
  3. 企業(yè)應(yīng)用
  4. 正文

語(yǔ)音識(shí)別技術(shù)科普:客知音電話機(jī)器人為您解讀人工神經(jīng)網(wǎng)絡(luò)

 2018-09-28 17:06  來(lái)源:互聯(lián)網(wǎng)  我來(lái)投稿 撤稿糾錯(cuò)

  域名預(yù)訂/競(jìng)價(jià),好“米”不錯(cuò)過(guò)

語(yǔ)音識(shí)別引擎的迅速發(fā)展推動(dòng)著人類進(jìn)入了一個(gè)新的時(shí)代,在萬(wàn)物互聯(lián)的基礎(chǔ)上,人類開始可以擺脫手動(dòng)鍵盤錄入信息,直接用語(yǔ)音和“萬(wàn)物對(duì)話”,更接近自然交流場(chǎng)景。這樣一種趨勢(shì)正在席卷人類生活的方方面面:智能穿戴設(shè)備、兒童陪伴機(jī)器人、智能車載、電話機(jī)器人等。

其實(shí)這樣的時(shí)刻已經(jīng)醞釀多時(shí)了。從1952年貝爾研究所成功識(shí)別10個(gè)英文數(shù)字到如今人們可以和機(jī)器人實(shí)時(shí)交流互動(dòng),語(yǔ)音識(shí)別背后的技術(shù)經(jīng)歷了幾個(gè)時(shí)期的重點(diǎn)突破。其中,人工神經(jīng)網(wǎng)絡(luò)(Artificial neutral Network,簡(jiǎn)稱ANN)是推動(dòng)語(yǔ)音識(shí)別技術(shù)到當(dāng)前水平的一匹黑馬。

可能我們會(huì)想當(dāng)然地以為人工神經(jīng)網(wǎng)絡(luò)是一個(gè)新興的概念,但它其實(shí)在1950年代就被提出來(lái)了!在20世紀(jì)80年代后期,神經(jīng)網(wǎng)絡(luò)成為一種流行的聲學(xué)建模方法。從那時(shí)起,神經(jīng)網(wǎng)絡(luò)已被用于語(yǔ)音識(shí)別的許多方面,例如音素分類,孤立詞識(shí)別,視聽語(yǔ)音識(shí)別,視聽說(shuō)話者識(shí)別和說(shuō)話者適應(yīng)。

根據(jù)百度百科的介紹,人工神經(jīng)網(wǎng)絡(luò)是借鑒生物學(xué)上神經(jīng)網(wǎng)絡(luò)的信息處理方式,建立模型后按照不同的連接方式組成的不同的網(wǎng)絡(luò)。那這樣一種運(yùn)算模型的基本原理是什么呢?

和往常的計(jì)算機(jī)運(yùn)行模式不同,神經(jīng)網(wǎng)絡(luò)系統(tǒng)不是根據(jù)事先編寫好的指令完成特定的任務(wù),而是像人一樣根據(jù)示范和例子進(jìn)行學(xué)習(xí)。例如在圖像識(shí)別領(lǐng)域,如何讓機(jī)器識(shí)別貓咪?機(jī)器并不知道貓到底是什么,例如四條腿有毛發(fā)和胡須的動(dòng)物,它毫無(wú)概念。但它能夠通過(guò)分析大量標(biāo)記著“貓”和“不是貓”的圖片庫(kù),自主學(xué)習(xí)并辨別出哪些圖片里有貓,哪些沒有。

人工神經(jīng)網(wǎng)絡(luò)模擬生物神經(jīng)網(wǎng)絡(luò),由連接著的節(jié)點(diǎn)或者神經(jīng)元組成。例如,一個(gè)節(jié)點(diǎn)A可以傳遞信號(hào)給另一個(gè)與之相連的人工神經(jīng)元B,而B可以處理收到的信號(hào)并能傳遞給與它相接觸的其他節(jié)點(diǎn)C、D、E、F、G等,這樣就形成了強(qiáng)大的信息處理和傳遞網(wǎng)絡(luò)。

在ANN的普遍運(yùn)用中,各個(gè)連接的節(jié)點(diǎn)傳輸?shù)男盘?hào)都是數(shù)字,而每次數(shù)字的傳輸都會(huì)經(jīng)過(guò)特定的轉(zhuǎn)化后輸出。那人工神經(jīng)網(wǎng)絡(luò)是如何學(xué)習(xí)的呢?原來(lái)每個(gè)連接都會(huì)隨著學(xué)習(xí)例子的過(guò)程計(jì)算它的權(quán)重,權(quán)重的大小可以強(qiáng)化或弱化連接的信息傳遞。通常,人工神經(jīng)元會(huì)集聚成不同的“層”,只有當(dāng)所有那一層的信息都通過(guò)了一個(gè)關(guān)卡時(shí),信息才能被傳輸。不同的“層”會(huì)對(duì)傳輸進(jìn)來(lái)的信息進(jìn)行不同方式的變換,因此信息從開始層傳到最后一層都會(huì)在各層之間轉(zhuǎn)化過(guò)了很多次。

當(dāng)然,以上只是對(duì)于人工神經(jīng)網(wǎng)絡(luò)最基礎(chǔ)的介紹,各個(gè)模型的應(yīng)用和測(cè)評(píng)在學(xué)術(shù)界時(shí)刻被交流和更新著??椭舻乃惴夹g(shù)人員更是在理論和實(shí)踐中把握著前沿動(dòng)態(tài),定期撰寫論文并組織研討,在自主研發(fā)的語(yǔ)音識(shí)別引擎的基礎(chǔ)上,不斷優(yōu)化專門領(lǐng)域內(nèi)的語(yǔ)音識(shí)別準(zhǔn)確率,做到比科大訊飛、百度、阿里等通用語(yǔ)音識(shí)別更準(zhǔn)確。

技術(shù)優(yōu)勢(shì).jpg

申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)文章

  • LTD樞紐云:信創(chuàng)“全面替換”門戶、黨群、經(jīng)營(yíng)管理類軟件產(chǎn)品

    信創(chuàng)即信息技術(shù)創(chuàng)新,是指通過(guò)自主研發(fā)、技術(shù)創(chuàng)新等方式,實(shí)現(xiàn)信息技術(shù)的自主可控,降低對(duì)外部技術(shù)的依賴,提高國(guó)家信息安全保障能力。

  • 助力企業(yè)跑出數(shù)智升級(jí)加速度,828 B2B企業(yè)節(jié)系列直播火熱開啟

    第三屆828B2B企業(yè)節(jié)正在全國(guó)如火如荼進(jìn)行中。作為中國(guó)首個(gè)以“提升企業(yè)數(shù)字化能力、助力企業(yè)穩(wěn)健快速成長(zhǎng)”為目標(biāo)的B2B企業(yè)節(jié),828B2B企業(yè)節(jié)由華為云聯(lián)合上萬(wàn)伙伴共同發(fā)起,目的是為了打通數(shù)字化供需天塹,讓科技企業(yè)和有數(shù)轉(zhuǎn)智改需求的中小企業(yè)能在一站購(gòu)平臺(tái)上完成對(duì)接,實(shí)現(xiàn)成就好生意,成為好企業(yè)的節(jié)日

  • 趙峰:提升銷售領(lǐng)導(dǎo)力,實(shí)現(xiàn)業(yè)績(jī)跨越式發(fā)展

    當(dāng)今世界經(jīng)濟(jì)局勢(shì)復(fù)雜多變,企業(yè)面臨著越來(lái)越激烈的市場(chǎng)競(jìng)爭(zhēng)。在生產(chǎn)方式不斷隨著科技水平的發(fā)展而提升的同時(shí),各個(gè)行業(yè)企業(yè)產(chǎn)品之間的差距越來(lái)越小,企業(yè)單純依靠產(chǎn)品很難在如今的市場(chǎng)競(jìng)爭(zhēng)中取勝。因此,如何為企業(yè)尋求更加富有競(jìng)爭(zhēng)力的銷售能力提升辦法,成為了企業(yè)普遍更加看重的問題。趙峰,現(xiàn)任北京正信啟德管理顧問有

  • 穿越周期:解碼2024年零售快消行業(yè)數(shù)字發(fā)展機(jī)密(附白皮書下載)

    零售經(jīng)營(yíng)者正處在一個(gè)歷史性的轉(zhuǎn)折點(diǎn)上。一方面,中國(guó)的零售產(chǎn)業(yè)已經(jīng)發(fā)展到門店渠道飽和的狀態(tài),優(yōu)勝劣汰會(huì)是零售產(chǎn)業(yè)未來(lái)一段時(shí)間內(nèi)的主旋律;一方面,中國(guó)消費(fèi)者的價(jià)值觀出現(xiàn)了顯著變化,零售快消市場(chǎng)已經(jīng)進(jìn)入“性價(jià)比時(shí)代”。為此,百望云總結(jié)服務(wù)諸多零售快消經(jīng)營(yíng)者的經(jīng)驗(yàn),集合產(chǎn)品與技術(shù),推出了數(shù)字化解決方案,并取

  • 固態(tài)電池市場(chǎng)大爆發(fā)前夜 這家電池企業(yè)打響第一槍

    受限于三元材料以及磷酸鐵鋰電池在能量密度、安全性、循環(huán)壽命等多方面的限制,純電汽車產(chǎn)品始終無(wú)法完成對(duì)傳統(tǒng)燃油車的致命一擊。在此背景下,優(yōu)勢(shì)明顯的固態(tài)電池被寄予厚望,眾多車企以及電池企業(yè)紛紛加碼這一細(xì)分領(lǐng)域,以求占領(lǐng)技術(shù)制高點(diǎn)。目前,業(yè)界普遍將全固態(tài)電池小批量量產(chǎn)上車的時(shí)間節(jié)點(diǎn)定在2027年左右,大規(guī)

  • 重磅 矢量智控官網(wǎng)正式啟用!

    嘿,朋友們!矢量智控(南京)科技有限公司官網(wǎng)www.ivcon.cn8月31日正式啟用啦!這將是矢量智控的重要里程碑,期待為AI+工業(yè)與制造業(yè)帶來(lái)更深入、更全面的服務(wù)。矢量智控作為南棲仙策旗下工業(yè)智能決策品牌,專注為高端裝備和復(fù)雜流程工業(yè)提供自主智能控制產(chǎn)品和方案。產(chǎn)品積淀前沿AI技術(shù)我們根據(jù)產(chǎn)品的

  • 科沃斯全球首款恒壓活水洗地機(jī)器人亮相,地面清潔能力跨時(shí)代提升?

    北京時(shí)間9月2日凌晨,科沃斯機(jī)器人CEO錢程的一條朋友圈引起業(yè)內(nèi)關(guān)注,搶先揭示了科沃斯將在2024德國(guó)柏林IFA展推出其地寶X系列新品。從簡(jiǎn)短的內(nèi)容中可以窺見,科沃斯內(nèi)部對(duì)于這款新品的信心和期待。從錢程朋友圈流出的圖片來(lái)看,猜測(cè)科沃斯此次新品將重點(diǎn)圍繞地面頑垢清潔的提升以及二次污染的問題解決。截至上

  • 地球山微電子與AP合作的第二代MEMS揚(yáng)聲器取得重大進(jìn)展

    經(jīng)過(guò)多年堅(jiān)持不懈的努力,以色列AudioPixels公司和中國(guó)地球山微電子公司雙方聯(lián)合研制的數(shù)字像素級(jí)MEMS揚(yáng)聲器技術(shù)取得重大突破。據(jù)AudioPixels官方發(fā)布消息顯示:新研制的第二代MEMS揚(yáng)聲器(GEN-II)所達(dá)到的聲壓級(jí)(SPL或“響度”)已被驗(yàn)證符合其商業(yè)化可行性的數(shù)字聲音重建(DS

  • 縱維立方與3D打印農(nóng)場(chǎng)主相聚2024深圳Formnext展,共探制造新模式

    2024年8月29日,深圳國(guó)際3D打印、增材制造展覽會(huì)(Formnext+PMSouthChina)在深圳國(guó)際會(huì)展中心13號(hào)館隆重舉行。本次展會(huì)以其豐富的活動(dòng)與論壇,再次彰顯了3D打印技術(shù)在商業(yè)發(fā)展中的廣泛應(yīng)用,尤其是在新興的“3D打印農(nóng)場(chǎng)”建設(shè)領(lǐng)域,縱維立方的兩款新品在農(nóng)場(chǎng)主群體中備受關(guān)注,并宣布

  • 拓元智慧受邀參加2024招銀浦江大會(huì),共享新型多模態(tài)大模型的前沿技術(shù)及產(chǎn)業(yè)化實(shí)踐

    8月30日,招商銀行在上海舉辦了“招銀浦江數(shù)字金融生態(tài)大會(huì)”,拓元智慧科技有限公司(以下簡(jiǎn)稱“拓元智慧”)應(yīng)邀參加本次大會(huì)。拓元智慧以其在人工智能領(lǐng)域的深厚積累與前沿探索,吸引了眾多行業(yè)內(nèi)外人士的關(guān)注。公司首席科學(xué)家王廣潤(rùn)博士在論壇上發(fā)表了題為《新型多模態(tài)大模型的前沿技術(shù)及產(chǎn)業(yè)化實(shí)踐》的報(bào)告,深入探