2016年是人工智能概念提及率爆發(fā)式增長的一年,智能語音作為人工智能中重要的領(lǐng)域之一,正在繼文字之后,成為非常重要的一個人機交互方式,同時語音技術(shù)的研究、開發(fā)與利用也越來越受到矚目。
8月6日,在中關(guān)村創(chuàng)業(yè)大街的車庫咖啡,百度開發(fā)者中心舉辦了主題為“百度語音識別和語音喚醒技術(shù)解析及實踐”的第65期技術(shù)沙龍,三位百度智能語音專家為大家分享了百度在語音技術(shù)上的開發(fā)經(jīng)驗和成果。
百度語音開放平臺產(chǎn)品經(jīng)理何蕩首先為大家?guī)硪粓鼍实姆窒?,從語義理解、語音識別、語音合成、后端資源四個角度給大家介紹了百度語音技術(shù),同時講解了百度下一步開放計劃。百度語音技術(shù)在今年二月份的時候,被美國麻省理工這一個權(quán)威的雜志評論為“2016年十大突破技術(shù)”,百度語音開放平臺的開發(fā)者數(shù)量已經(jīng)超過了12萬,“每天識別的在線請求數(shù)在1億以上,合成的在線請求數(shù)在2.5億到3億之間”何蕩用數(shù)據(jù)說明了百度語音的用戶使用概況,并從識別和合成兩個方面展示了百度語音效果。
百度語音資深研發(fā)工程師魏力凱以自己的親身經(jīng)歷切入,為大家進行了精彩絕倫的經(jīng)驗分享。一句:理想很豐滿,現(xiàn)實很骨干,道出了他6年語音和應(yīng)用開發(fā)上的體會與感悟。魏力凱分別從在線自定義、離線自定義、自定義語義、語法編輯器四大層面解釋了語音技術(shù)的四大功能。“首先打開開放平臺的首頁,點擊產(chǎn)品與服務(wù),主要的開發(fā)技術(shù)有三項,識別、合成和喚醒,代表了自定義模塊可以看到這個廣角。”魏力凱隨后向現(xiàn)場開發(fā)者介紹了語法編輯器工具的使用注意事項。
負責(zé)喚醒和語音技術(shù)的測算和算法研究的工程師唐立亮,現(xiàn)場向開發(fā)者介紹了什么是語音喚醒技術(shù),并指出了喚醒的正確率和誤報率以及功耗問題。“第一個是置信度的方案,其實通過某種方式的某種得分,判定喚醒效果的好壞。第二個是基于識別的喚醒系統(tǒng),也就是說在喚醒的后邊接一個識別系統(tǒng)。這個識別系統(tǒng)說什么都能有一個結(jié)果,同樣說喚醒詞也會有一個識別結(jié)果。接下來第三部分是基于垃圾詞網(wǎng)絡(luò)的技術(shù),垃圾詞和喚醒詞進行一個并連或者是串聯(lián)。得到最終的結(jié)果,這是之前的三個方向的技術(shù)。”唐立亮現(xiàn)場分享了語音喚醒技術(shù)的解決方案。并在后續(xù)演講中闡釋了所用到比較核心的技術(shù)模塊。
沙龍在每一位主講人講完以后有一到兩個提問的環(huán)節(jié),還會有一個現(xiàn)場的案例演示以及QA互動的環(huán)節(jié)。在提問環(huán)節(jié)中,不少觀眾與嘉賓進行了現(xiàn)場互動,觀眾們向三位分享者探討交流自己在語音開發(fā)上所面臨的困惑與難題,三位嘉賓對于觀眾的提問也給出了具有借鑒意義的回復(fù)。
據(jù)了解,百度技術(shù)沙龍是由百度開發(fā)者中心主辦,InfoQ負責(zé)策劃、組織、實施的線下技術(shù)交流活動,每月1期,旨在為中高端技術(shù)人員提供一個自由的技術(shù)交流和分享的平臺。百度技術(shù)沙龍通過向開發(fā)者共享百度核心技術(shù)、數(shù)據(jù)和資源,為開發(fā)者提供全方位服務(wù)和支持。作為國內(nèi)互聯(lián)網(wǎng)巨頭,百度開發(fā)者中心是百度扶持行業(yè)發(fā)展、創(chuàng)造共贏生態(tài)的一面窗口,越來越高的人氣顯示,百度開發(fā)者中心技術(shù)沙龍正在成為開發(fā)者追逐夢想的必經(jīng)之地。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!