1. 創(chuàng)業(yè)頭條
  2. 前沿領域
  3. AI智能
  4. 正文

百度輸入法首創(chuàng)離線中英自由說,識別流暢度與精準度均行業(yè)領先

 2020-07-30 09:34  來源:互聯(lián)網(wǎng)  我來投稿 撤稿糾錯

  一鍵部署OpenClaw

近日,AI實力強勁的百度輸入法又向業(yè)內(nèi)投下一顆“重磅炸彈”——業(yè)界首發(fā)“離線中英自由說”功能。這項基于中英文SMLTA模型的創(chuàng)新功能,讓用戶在弱網(wǎng)甚至無網(wǎng)絡環(huán)境中,依然可以順暢地進行中英文語音混輸,且識別準確率和有網(wǎng)絡時一樣優(yōu)秀, 準確率超過98%。百度輸入法在此前推出的“在線中英自由說”功能基礎上,借助AI技術賦能對語音輸入進行了又一次重大升級,大幅提升了用戶交互效率,全感官輸入2.0再迎重磅升級。

(百度輸入法離線中英自由說功能)

據(jù)了解,百度輸入法此次推出的“離線中英自由說”功能已經(jīng)在V9.3.5版本中全新上線。除支持中英文夾雜的離線混合輸入之外,還可精準識別離線狀態(tài)下的英文整句、中文整句輸入。例如用戶不便打字正在用語音輸入一段話,可一走進地鐵,語音識別卻跟不上。而百度輸入法的離線中英自由說功能就能很好地解決這個問題,它支持用戶在地鐵、電梯、高鐵或隧道這類弱網(wǎng)甚至斷網(wǎng)的環(huán)境下,依然可以自如流暢地語音錄入,且無需進行中英文手動切換。此外,“離線中英自由說”依舊支持流式識別,即語音輸入可以跟隨用戶的話音逐字實時上屏,滿足用戶對語音識別實時性和流暢性的高需求,真正讓用戶實現(xiàn)了“隨時隨地隨心說”。

一直以來,離線的語音輸入就是行業(yè)一大難題,由于傳統(tǒng)的離線中英文混合識別計算資源有限,需要限制模型的體積,因此極大限制了離線識別系統(tǒng)的性能。而百度輸入法的離線中英文語音識別系統(tǒng),針對性地采用中英文混合建模技術,提出基于低幀率、低比特的中英文SMLTA模型,其中采用神經(jīng)網(wǎng)絡語言模型替換傳統(tǒng)的N元語言模型,大大減少了離線識別模型的體積。與此同時,基于SMLTA的離線中英文語音識別系統(tǒng)還是首個基于Attention的端到端離線語音識別模型的產(chǎn)品部署,大幅提升了離線中英文語音識別系統(tǒng)的性能。

在AI技術加持下,百度輸入法的語音輸入能力不斷突破,在創(chuàng)新功能、用戶使用頻次、體驗滿意度等方面始終領跑行業(yè)。今年年初線上交流需求爆發(fā),百度輸入法便捷、高效、準確的語音輸入功能便成為特殊時期人們的溝通首選,自1月25日春節(jié)假期以來,日均語音請求量破10億次大關,并且“扛住”了高流量和用戶高標準的雙重“高壓”,持續(xù)為用戶提供不卡頓、不出錯的語音輸入服務。此后艾媒咨詢發(fā)布的《2020中國第三方手機輸入法市場疫期專題報告》也表明,百度輸入法在行業(yè)內(nèi)拿下用戶日均語音輸入次數(shù)、滿意度等多個行業(yè)第一。百度輸入法深諳用戶對于多語種、多環(huán)境下語音輸入的需求與痛點,不斷降低著語音輸入的使用門檻,自然也收獲了用戶和行業(yè)的廣泛認可。

從“中文識別”到“中英自由說”,從“在線狀態(tài)”到“離線環(huán)境”,百度輸入法對AI技術的應用,不僅提升了手機輸入法的智能化程度,也極大改善了人機交互效率。當語音輸入日漸主流,用戶習慣加速養(yǎng)成,對于手機輸入法廠商而言既是機遇也是挑戰(zhàn),相信百度輸入法還將加碼AI技術的應用,驅動語音輸入繼續(xù)升級迭代,持續(xù)優(yōu)化“全感官輸入2.0時代”的AI輸入體驗。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關文章

  • 甌江論道:AI賦能綠色發(fā)展

    2025年10月25日,2025世界青年科學家峰會之人工智能(AI)融合創(chuàng)新發(fā)展論壇在浙江溫州成功舉辦。本次論壇由國際院士科創(chuàng)中心主辦,中國投資協(xié)會能源投資專業(yè)委員會、溫港院士科創(chuàng)中心承辦,中國電工技術學會、中科先進技術溫州研究院與溫州市電力工程學會提供支持,以“甌江論道-AI賦能綠色發(fā)展”為主題,

    標簽:
    ai技術
  • 王通:未來個人創(chuàng)業(yè)的十個機會

    個人創(chuàng)業(yè)需要啟動成本低、無需龐大團隊、可快速驗證、能利用個人技能或資源。這里分享適合個人創(chuàng)業(yè)的十個機會一.AI內(nèi)容優(yōu)化與本地化服務·做什么:幫助企業(yè)或個人利用AI工具(如GPT-4,Midjourney)優(yōu)化內(nèi)容生產(chǎn)流程。例如,為跨境電商撰寫多語言產(chǎn)品描述,為小紅書博主生成爆款文案,為小公司制作營銷

  • 百度智能云PaddleOCR 3.1正式發(fā)布:關鍵能力支持MCP

    百度AI團隊今日正式推出PaddleOCR3.1版本,以突破性的多語言組合識別(MultilingualCompositionPerception,MCP)技術為核心,徹底重構復雜文檔處理邊界。此次升級標志著OCR領域首次實現(xiàn)對同一文檔內(nèi)任意混合語言文本的精準識別,為全球化企業(yè)、跨境業(yè)務及多元文化場

    標簽:
    ai智能
    ai技術
  • AI工具導航網(wǎng)站,未來的發(fā)展前景怎么樣?

    導航網(wǎng)站的崛起:從信息過載到精準觸達隨著全球AI工具數(shù)量爆發(fā)式增長(2025年已超數(shù)萬款),用戶面臨前所未有的選擇困境。傳統(tǒng)搜索引擎的“關鍵詞-鏈接”模式難以應對工具篩選的場景需求,垂直化、場景化的AI導航網(wǎng)站應運而生。這類平臺通過聚合、評測、分類與推薦四重機制,將分散的工具資源整合為結構化入口。例

  • 微信AI搜索被指“強行開盒”:名字成了數(shù)據(jù)入口,騰訊回應“僅用公開信息”

    當微信公眾號文章中出現(xiàn)一個人的名字,它會自動變成藍色鏈接,點擊即可查看AI生成的“個人簡歷”——這一微信新功能讓不少用戶感到被“扒光”在互聯(lián)網(wǎng)上。近日,微信新上線的“AI搜索”功能陷入隱私泄露爭議漩渦。多位網(wǎng)友在社交平臺反映,當微信公眾號推文中出現(xiàn)本人姓名時,名字會自動變?yōu)樗{色超鏈接,點擊即可瀏覽由

    標簽:
    ai技術
    ai搜索
  • 一秒當導演:小云雀上線短劇Agent,10萬字劇本一鍵生成60集

    凌晨兩點,小王合上筆記本,揉了揉酸脹的眼睛。花了一個月寫出來的10萬字短劇劇本躺在硬盤里,要真正把它拍成劇,得找演員、租場地、請攝像、做后期……粗算下來少說要幾十萬,他只能把劇本繼續(xù)鎖在抽屜里。不過,現(xiàn)在小王的劇本可以“見光”了。2026年3月19日,字節(jié)跳動旗下的小云雀AI正式上線了短劇Agent

    標簽:
    大模型
  • 騰訊云推出“龍蝦”記憶服務,準確率飆升近六成

    你一定遇到過這樣的場景:明明剛和AI助手聊了半個小時的項目細節(jié),退出會話后重新打開,它卻像個失憶患者一樣,連你上一輪說過什么背景信息都忘得一干二凈,你又得從頭把需求講一遍。這種“聊完就忘”的體驗,讓無數(shù)使用AI智能體的用戶深感頭疼。為了解決這一普遍困擾,騰訊云在4月3日正式推出了名為“龍蝦”的記憶服

  • 谷歌 Gemma 4 正式開源,開源賽道迎來變局!

    4月3日凌晨,谷歌DeepMind悄然甩出一枚重磅炸彈——全新一代開源大模型Gemma4正式發(fā)布,以極其寬松的Apache2.0協(xié)議向全球開發(fā)者免費開放。這是自2025年3月發(fā)布Gemma3以來,谷歌時隔整整一年的重大迭代。本次發(fā)布的Gemma4包含四個不同規(guī)格的版本:E2B(有效20億參數(shù))、E4

    標簽:
    大模型
  • OpenClaw常見的五種“病”,到底該怎么“治”?

    AI龍蝦也會生病。別怕,大部分病不是什么絕癥,自己在家就能治。我養(yǎng)OpenClaw一年多,總結出五種最常見的毛病,附上我的“土方子”,希望對你有用。病一:不吃食(完全不執(zhí)行任何任務)癥狀:你給了指令,它沒反應,日志里一片空白。就像龍蝦趴在塘底不動彈,碰它也不理。病因:通常是進程卡死了,或者依賴服務沒

熱門排行

編輯推薦