1. 創(chuàng)業(yè)頭條
  2. 前沿領域
  3. AI智能
  4. 正文

智能音箱迎來升級戰(zhàn),語音識別成為其破局的關鍵

 2018-08-18 13:52  來源:A5專欄  我來投稿 撤稿糾錯

  一鍵部署OpenClaw

文/陳劍鋒

戶主回到家,室內燈就自動開啟,室溫調至適宜溫度;

同時類似siri的小管家,還會貼心告訴你該要添置哪些家用了,步驟也不勞你費心,只要下個命令,siri就會去線上下單;

當你出門在外,你的汽車能完美實現(xiàn)自動駕駛,根本不用操心路況和認路問題。

以為這樣就玩了嗎?精彩的還在后頭——

如果在行駛的過程中你抑制不住心中的*開始..啪...啪...,這就算了,如果你還把玩著方向盤,siri是絕對不樂意了,還會勸你把管好你的幾幾。

你一定以為這是我幻想出的場景,其實不然,這是日前剛上映的外國科幻驚悚片《升級》中的場景。不過它或許在不久之后會映射入我們的真實生活場景當中。

智能音箱市場表面上形勢一片大好

在目前全球范圍內掀起的人工智能浪潮中,智能音箱作為全新的人機交互體驗最佳的入口,成為了世界科技巨頭們打開AI大門必爭的突破口。目前智能音箱市場仍舊以亞馬遜Alexa為領先,其次是谷歌,而蘋果Siri和微軟Cortana仍處于苦苦追趕之勢。據(jù)【TechWeb】8月7日消息,亞馬遜憑借著這波熱潮,在全球售出了超過5000萬臺Alexa智能音箱,并希望憑借這個機會將自家產(chǎn)品與智能音箱進行整合。

再回到國內,隨著BAT的不斷加持和其它實力毫不遜色的互聯(lián)網(wǎng)獨角獸的全力布局,國內智能音箱市場同樣迎來了前所未有的迅猛發(fā)展。根據(jù)Canalys的最新統(tǒng)計數(shù)據(jù)顯示,在2018年第二季度的全球智能音箱市場份額占比當中,中國智能音箱表現(xiàn)非常強勢,其中可以看到谷歌第一、亞馬遜第二,天貓精靈第三、小米第四。

值得一提的是,小米作為后殺人互聯(lián)網(wǎng)的手機制造商,憑借著“高性價比”和“爆款”的模式迅速突破層層防線入主眾多領域建立起強大的小米生態(tài)體系,智能音箱就是其中輝煌的一筆。

小米從去年到現(xiàn)在扎努了整個市場的12.2%份額,我們看到小愛同學憑借一個非常低的價格,在國內市場頗受歡迎。與其他廠商不同的是,小米將智能音箱的門檻放得很低,而且打通了小米手機的語音助手,利用深度學習算法,做到不錯的表現(xiàn)效果。而在剛過去的15日,雷軍就宣布小愛同學的每月活躍設備數(shù)量超過3000萬,這也是小米IPO以來聽到的最好的消息。

由此可見,無論是在國外、還是在國內,智能音箱市場似乎整體看起來表現(xiàn)的都還不錯,形勢一片大好。但事實真的是這樣嗎?

智能語音的可控性值得擔憂

世界巨頭都在爭奪智能音箱通往AI的這個超級入口,但并不代表這個入口就已經(jīng)足夠的成熟,只是巨頭們不想錯過這個最佳的入口而已。事實上智能音箱只是一個載體,核心在于搭載的智能語音交互系統(tǒng)(即語音識別),而語音識別作為研究AI的重要基礎,在語意的理解能力和識別的精準度的技術上是無法達到爐火純青的地步的,尤其是在搭載智能音箱之后的語音的控制上面值得擔憂。

盡管在考慮到全球語音市場的競爭格局之后,據(jù)外媒最新消息,亞馬遜Alexa和微軟的Cortana兩大語音助手正式聯(lián)姻。但也許仍然無法達到其預想中的完美形態(tài),譬如就無法播放部分在線音樂服務等。

這還不是最關鍵,最關鍵的是你無法掌握語音的可控性,簡單的來說,也就是你根本不知道什么時候就會無意間喚醒siri,更不知到從何時起你的談話被偷聽了,當快遞小哥突然給你送來一個包裹你卻還一臉懵逼。

據(jù)筆者在雷鋒網(wǎng)獲悉,在國外發(fā)生一件奇葩的新聞,亞馬遜Echo協(xié)助警方避免了一起謀殺案。國外一名男子在與女友發(fā)生爭吵時,男子拿槍指著女友質問她:“你給警長打電話了?”而在旁邊的谷歌 Home 聽到了“給警長打電話”的命令,所以也就按命令執(zhí)行了。最后特警隊抵達事件所在地,安全的制止了事件的進一步發(fā)生。

這看起來還算是一件很好的事情,至少Echo可以幫你解決突發(fā)的危險和狀況。不過接下來的案例就不得不讓你生無可戀、甚至驚悚。

據(jù)說,國外一家洋娃娃公司在電視上播放了一則玩偶之家的廣告,該地區(qū)竟然數(shù)個家庭的亞馬遜Echo在聽到廣告后自動開始在網(wǎng)上訂購玩偶之家。這還不算,在國內浙江大學電氣工程學院智能系統(tǒng)安全實驗室甚至曾成功對亞馬遜的音箱 Echo發(fā)起了“海豚攻擊”,通過利用麥克風的硬件漏洞,成功“黑”進智能設備的語音助手系統(tǒng),通過發(fā)出人耳無法聽到的超聲波語音,讓語音助手執(zhí)行他們所下達的指令,比如讓 Echo 在亞馬遜上買個東西。

而更加驚悚的是,MWR InfoSecurity 的研究人員發(fā)現(xiàn),老款亞馬遜 Echo 智能音箱中存在一個安全漏洞,黑客可以將 Echo 音箱變成*,而又不影響它的整體功效。原理是研究人員通過制作的一個插頭把 Echo 連上了筆記本電腦和 SD 讀卡器。然后利用調試工具破解了 Echo 的系統(tǒng),寫進去了一個專用的引導程序。而這臺 Echo 所有聽到的音頻流都會自動轉發(fā)到他的遠程服務器上,關鍵的是這臺智能音箱的其他功能看上去竟然一切正常。

也就是如果一旦智能音箱被不法的黑客入侵,用戶的大量數(shù)據(jù)和隱私安全將受到大量的威脅。

口語仍舊是語音識別很難突破的壁壘

再回到語意識別的精準度上,雖然如今全球在AI技術上不斷的突破,語音識別的精準度和理解能力上也達到堪稱完美的地步,諸如曾經(jīng)有媒體報道,谷歌Google Assistant將在2018年底將支持超過30種語言;除此之外,高通已經(jīng)開發(fā)出了一款能夠識別單詞和短語的語音識別設備,準確率高達95%。

不過如果這用在中文測試上,或許會顯得很Low了。眾所周知,中國在經(jīng)過幾千年的文化更替,其文字早已變得難以捉摸,尤其是演變出濃厚的各種地方特色語言早已超過了30種,就連中國人都不一定能夠聽得懂、更不用說毫無生機的機器語音識別了。

譬如,在一項研究中,就有人通過Alexa測試識別一些非本土口語的語種,結果顯示不準確率可達30%。而面對以西班牙語和漢語作為第一語言的人說英文,不管是Google Home還是亞馬遜 Echo,其識別率都是低的嚇人。

寫道最后

總而言之,語音識別在目前看來依然還存在眾多技術在短時間仍舊無法突破的壁壘。巨頭們大量的搶占智能音箱市場,只是因為它作為通往臥室鏈接AI最佳的解決方案。在巨頭們搶占了這個入口的同時,并不代表他就掌握了AI的超級入口,仍舊需要在語音識別的技術提升、創(chuàng)新上面不斷的研究和突破。

否則,即使你先搶占了智能音箱這個超級入口,但在智能音箱不斷迎來升級戰(zhàn)的過程中,你依然會很容易被后來者輕而易舉的超越和取代,畢竟AI作為技術創(chuàng)新極強的領域,只有不斷的技術創(chuàng)新和迭代升級,才有可能安穩(wěn)的渡過這場升級戰(zhàn),至于說能不能夠成為行業(yè)的標桿,至少得先活下來吧!

【陳劍鋒,科技自媒體人,長期關注AI和IoT等前沿科技,微信公眾號:劍鋒撩科技(cjftmt)】

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關標簽
智能音箱

相關文章

  • 《EAI-100 具身智能領域2025年度百項代表性成果與人物》重磅發(fā)布

    2025年,被業(yè)界公認為具身智能(EmbodiedAI)真正覺醒的元年。當人工智能跨越數(shù)字世界的邊界,轟然撞開物理世界的大門,是誰在荒野中劈開荊棘?又是誰在定義行業(yè)的未來?由魔搭社區(qū)(ModelScope)、CCF智能機器人專委會、工信部裝備數(shù)字孿生技術重點實驗室、Lumina具身智能社區(qū)、開放原子

  • Token中文新譯名:「符元」——一文七個維度講清Token的本質定義

    拒絕“智元”走私語義,七維拆解Token物理本質,定義AI時代唯一真名:「符元」。

  • 9個月內用戶增長千萬,魔搭社區(qū)已服務2500萬開發(fā)者

    3月22日,智匯金陵·AI開源人才峰會暨魔搭開發(fā)者大會在南京舉辦。從去年6月30日至今,魔搭社區(qū)用戶數(shù)從1600萬增長至2500萬,9個月內用戶增量近千萬;魔搭社區(qū)上的開源模型數(shù)量從7萬增長至17萬,9個月內新增10萬個開源模型,包括DeepSeek、智譜、MiniMax、階躍星辰、Mistral等

  • 20%員工或被裁、1.6萬人離開:Meta醞釀史上最大規(guī)模裁員

    文/楊雪健來源/節(jié)點財經(jīng)Meta或迎來史上最大規(guī)模裁員潮。2026年3月14日,路透社曝出Meta正計劃啟動新一輪大規(guī)模裁員,此次裁員比例或達公司總員工數(shù)的20%,按其近7.9萬的員工規(guī)模計算,約1.58萬名員工或將被裁。若該計劃執(zhí)行,將成為Meta自2022年底實行“效率之年”重組后規(guī)模最大的一次

  • 阿里發(fā)布全球首個企業(yè)級Agent平臺“悟空”

    3月17日,阿里發(fā)布全球首個企業(yè)級AI原生工作平臺——“悟空”,讓每個團隊、每家公司,都能擁有一支24h工作的”龍蝦軍團”。悟空是一款獨立應用,即日起開啟邀測,也將直接內置到超2000萬企業(yè)組織的釘釘之中。擁有8億用戶的釘釘重寫底層代碼,進行全面CLI(命令行界面)化改造,讓悟空Agent能夠原生操

  • 90%的AI中間商會消失:Google封號只是第一槍

    AI的“免費紅利期”結束了,未來18個月,靠“API倒賣”的公司,會成片消失。這個導火索就是最近Google的一輪封號導致的,隨著封號風波的結束,這也標志著AI行業(yè)【收租時代】來了。2月封號潮:高付費用戶被一鍋端一周前,Google開始大規(guī)模封號,付著250美金月費的人,賬號說沒就沒,Gmail、Y

編輯推薦