專業(yè)機構發(fā)布《2019年語音技術》報告稱,語音將成為未來十年決定性主題之一,與人工智能一起從根本上改變?nèi)伺c機器的關系。近日,搜狗輸入法在語音輸入領域率先推出“個性化語音識別”功能,突破語音識別技術瓶頸,大幅優(yōu)化個人詞匯錄入的直接準確性,在語音輸入領域?qū)崿F(xiàn)“更懂用戶”。
搜狗“個性化語音識別”打造用戶專屬輸入法
在日常交流中,個人口頭禪、慣用語經(jīng)常會干擾雙方的信息傳達,這一問題在人機語音交互中尤為凸顯。在語音輸入時,往往用戶只是想錄入一個名稱,輸入結果卻顯示的是音同意不同的另一項結果。比如,當用戶希望輸入法顯示人名“憑遠”時,通用的語音識別往往將大眾常用的“平原、品源”列在前列的候選詞匯,用戶的個性化內(nèi)容并不在其中。除此之外,用戶習慣使用的個人詞匯,以及一些多音字、讀音差錯也會對語音識別結果造成影響。
基于以上原因,搜狗語音率先對語音識別技術進行了革新優(yōu)化,推出“個性化語音識別”服務。經(jīng)過本輪更新,用戶只需在搜狗輸入法App選擇一鍵登錄個人賬戶,即可體驗此項服務。成功開啟后,“個性化語音識別”會通過強化學習用戶習慣使用的個人詞匯,為每個用戶建立定制化語音輸入法。此后,在用戶需要進行語音輸入時,輸入法會根據(jù)語言環(huán)境,結合上下段落語句進行分析,快速輸出符合用戶心意的文本內(nèi)容,有效減少用戶手動進行二次更改的頻率。
搜狗語音又誕生“黑科技”語音識別更精準
搜狗“個性化語音識別”不僅可有效提升用戶個性化詞句的識別準確率,同時全自動詞庫學習這一特色極大保證了系統(tǒng)的處理及反饋速度,實現(xiàn)整個學習個性化特征的過程在“毫秒級別”就可以全部自動完成。
通過DTSS(Deep Transformer-based Sequence to Sequence model)的端到端聲學模型、神經(jīng)網(wǎng)絡語言模型和智能標點預測等技術,搜狗輸入法引入前沿深度學習技術,對語音識別進行仿真模擬和訓練,有效提高語音錄入在通用場景下的識別準確性,精準度已達到領先業(yè)內(nèi)。“個性化語音識別”可基于用戶數(shù)據(jù)分析,對用戶習慣使用的個性化詞組進行掃描記錄,在語音輸入時,優(yōu)先選擇用戶習慣用語進行文本輸出。通過此項技術革新,在保障通用識別準確性的前提下,使用戶常用語的字詞錯誤率下降40%,攻克語音識別精準化的技術難關。
掌控AI從個性化語音識別開始
手和舌頭是人類最靈活的兩個部分,從移動智能設備發(fā)展以來,各種觸控交互無不依賴于手的操作。而當語音技術和人工智能同時走向成熟時,或許就像《2019語音技術報告》中所描述的那樣:語音交互扭轉(zhuǎn)了以往人機交互的存在形態(tài),用戶與設備間基于語音交互的全新關系開始搭建,與之前互聯(lián)網(wǎng)向移動互聯(lián)網(wǎng)過渡一樣,其對底層平臺的全新需求也在醞釀當中。
新時代即將來臨,為應對人工智能、虛擬現(xiàn)實等技術的革新以及不同維度、多場景使用的需要,用戶輸入法的使用習慣逐漸向語音輸入轉(zhuǎn)移。同時,與文本輸入相比,語音輸入注定成為最主要的人機互動接口。優(yōu)化語音識別技術,為用戶提供更自然、更便利、更高效的語音錄入服務,是智慧輸入法的發(fā)展趨勢。
隨著語音識別技術的不斷成熟,以及用戶個性化詞庫的不斷豐富,搜狗將聚合用戶級語音個性化資源,實現(xiàn)“定制化語音輸入法”。使每個用戶基于“定制版”、“更懂自己”的搜狗語音識別的支持,在日常生活以及醫(yī)療、法律等專業(yè)領域,有效提高線上交流和人機溝通的效率及準確度,或?qū)⒊蔀槿斯ぶ悄軙r代輸入端的全局掌控者。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!
2023年7月6日,第六屆世界人工智能大會(WAIC2023)在上海開幕,“人工智能大模型”是本屆大會的備受矚目的話題,據(jù)悉,在昇騰AI大模型的創(chuàng)新研發(fā)中,華為聯(lián)手26家行業(yè)領軍企業(yè),組建了一支協(xié)同創(chuàng)新的“AI明星隊”,云天勵飛作為中國人工智能企業(yè)的杰出代表,和互聯(lián)網(wǎng)大廠、運營商、科研院所等優(yōu)秀團隊
這幾個月來,以ChatGPT為代表的生成式AI展現(xiàn)出的能力令世界驚嘆。自從2016年AlphaGo戰(zhàn)勝李世石掀起了一波AI浪潮后,AI仿佛已經(jīng)沉寂了很久,ChatGPT的橫空出世就如同一束耀眼的光芒,讓AI這個名詞重回C位。過去在AI1.0時代,主要通過訓練模型來實現(xiàn)圖像識別、聲音識別、語言處理等特
文:互聯(lián)網(wǎng)江湖作者:志剛2023年的IoT需要一個新故事。6月29日,涂鴉智能在開發(fā)者大會上,發(fā)布了企業(yè)級戰(zhàn)略PaaS2.0,希望通過一個平臺+四大開發(fā)服務,建立起IoT生態(tài)。對于這場發(fā)布會,市場的態(tài)度是積極的。美東時間6月29日收盤,涂鴉智能美股股價上漲5.6%,來到1.87美元/股。近日股價穩(wěn)定
美團曾經(jīng)的二號人物王慧文對標OpenAI的創(chuàng)業(yè)項目光年之外,以20億賣給美團,再度引發(fā)市場對大模型的熱議。
2020年底,王慧文在朋友圈寫下這句話時,外界本以為這位伴隨中國互聯(lián)網(wǎng)發(fā)展而持續(xù)創(chuàng)業(yè)20年的人物即將告別創(chuàng)業(yè)舞臺。但是,一個曾經(jīng)多次創(chuàng)業(yè),正值壯年的互聯(lián)網(wǎng)老將心中的創(chuàng)業(yè)熱情是難以熄滅的。
蘋果16弄了兩個版本,一個是專門給中國人用的,準備用百度的AI,還要交錢。第二個是全世界都可以用的,用了ChatGPT,包括臺灣、香港、澳門都可以用。以后都這樣了。好,問題就出在這,蘋果和百度的合作出現(xiàn)問題了,新聞連起來看,才能明白其中含義。新聞一:蘋果正在和騰訊、字節(jié)初步接洽,考慮將二者的AI模型
“技術日新月異,人類生活方式正在快速轉(zhuǎn)變,這一切給人類歷史帶來了一系列不可思議的奇點。我們曾經(jīng)熟悉的一切,都開始變得陌生?!庇嬎銠C之父約翰·馮·諾依曼曾這樣說到。
“人工智能的商業(yè)模式,是要創(chuàng)造一個市場,而非一個算法”。這是世界AI泰斗MichaelI.Jordan的觀點。而當前的全球AI市場,占據(jù)主導地位的中美雙方,卻也走出了兩條截然不同的技術路徑,前者執(zhí)著于前沿技術的探索,后者則發(fā)力應用優(yōu)化和商業(yè)化落地。南轅北轍的兩個方向,或許已經(jīng)無法直接進行排位先后、優(yōu)
智能體進化發(fā)展了一年,現(xiàn)在的RPAAgent迭代到什么程度了?從實在智能最新發(fā)布的實在Agent7.0,看RPAAgent的迭代升級抓取豆瓣信息、自己制作PPT,這款AIAgent真的實現(xiàn)了流程全自動化AIAgent構建到執(zhí)行全自動化,持續(xù)進化RPAAgent再次降低智能體應用門檻實在智能重磅發(fā)布實
崔大寶|節(jié)點財經(jīng)創(chuàng)始人進入2024年,大模型似乎有熄火之勢:資本市場,與之關聯(lián)的概念炒不動了,英偉達股價動輒暴跌重挫,引發(fā)“泡沫戳破”的擔憂;消費市場,BATH們的推新活動少了,產(chǎn)品更新迭代的速度慢了,民眾的關注度降了……熱鬧的大概只剩下兩場酣仗:自5月15日字節(jié)跳動宣布“以厘計費”,打響國內(nèi)大模型
文|智能相對論作者|陳泊丞好消息!你心心念念的事業(yè)單位發(fā)錄取公告了!壞消息!他們沒錄你,錄了個數(shù)字人。圖片來源網(wǎng)絡隨著數(shù)字人技術的突破,越來越多的傳統(tǒng)企業(yè)和機構開始用上了“數(shù)字員工”。甚至很多中國人心心念念的“鐵飯碗”,也被這些數(shù)字人給捧上了。數(shù)字人捧上了“鐵飯碗”簡單翻看一下全國各地事業(yè)單位的“錄
黑芝麻智能敲鐘后,港交所門口又有一些智駕芯片企業(yè)引發(fā)關注。據(jù)悉,近日地平線已通過中國證監(jiān)會IPO備案,擬發(fā)行不超過11.5億股境外上市普通股并在香港聯(lián)合交易所上市,預計籌集約5億美元資金。從天眼查可以了解到,該公司成立于2015年,是一家乘用車高級輔助駕駛(ADAS)和高階自動駕駛(AD)解決方案供
8月21日,萬眾矚目的2024世界機器人大會暨博覽會在北京亦創(chuàng)國際會展中心盛大開幕。這場為期5天,集“展覽”“論壇”“賽事”于一體的機器人盛會,反映了當下機器人領域的繁榮生態(tài)。據(jù)官方統(tǒng)計數(shù)據(jù),今年現(xiàn)場逛展觀眾高達25萬人次,比去年增加25%。機器人行業(yè)有多火?看看2024世界機器人大會火爆程度便可知