文 ▍李東樓(微信號:lidonglou)
在美國導(dǎo)演斯派克·瓊斯編劇并執(zhí)導(dǎo)的一部科幻愛情片《她》(Her)當(dāng)中,語音交互幾乎成為了人們與手機(jī)、電腦等設(shè)備進(jìn)行交互的唯一手段,打電話、寫信、處理工作郵件等等,都通過語音向計(jì)算機(jī)發(fā)出指令。而且其中的人工智能操作系統(tǒng)OS1還與人類有了情感交流,談起了戀愛,而影片的背景被設(shè)定在2025年,也就是從現(xiàn)在算起九年之后。
當(dāng)然,我們無法預(yù)測,人工智能在九年后究竟會不會發(fā)達(dá)到這個(gè)地步?但眼下可以肯定的是,人工智能技術(shù)確實(shí)已經(jīng)開始從實(shí)驗(yàn)室逐步走近我們的生活,尤其是今年年初的谷歌alphago圍棋機(jī)器人和李世石的人機(jī)對決大戰(zhàn),更是讓人們首次見識到人工智能的強(qiáng)大之處。而在昨天,搜狗語音發(fā)布了不僅“能聽會說”,還具有“能理解會思考”的能力的語音交互引擎技術(shù)—知音,這再次刷新了在場所有人對于人工智能技術(shù)發(fā)展的認(rèn)知。
搜狗知音引擎發(fā)布,展現(xiàn)搜狗在人工智能方面的自信
就如同影片《她》當(dāng)中,男主人公通過語音寫信一般,基于語音識別和語義理解技術(shù)方面的進(jìn)步,搜狗語音早已達(dá)到了可以實(shí)時(shí)轉(zhuǎn)寫的地步。值得一提是,在昨天的發(fā)布會上,嘉賓的發(fā)言就通過搜狗知音交互引擎實(shí)時(shí)轉(zhuǎn)寫并呈現(xiàn)在大屏幕上,不僅語音識別速度快,而且準(zhǔn)確率也相當(dāng)高,基本上能夠達(dá)到90%以上,令人驚嘆技術(shù)的進(jìn)步。
而這還只是搜狗知音引擎的簡單“炫技”,除了語音識別之外,根據(jù)搜狗CTO楊洪濤介紹,搜狗知音引擎還支持用戶直接用自然語言進(jìn)行糾錯(cuò),比如用戶可以說:“把‘張’修改為立早‘章’,或者把‘張’修改為文章的’章’。并且還支持多輪對話,比如用戶說我要去首都機(jī)場,搜狗知音引擎便會問 T1還是 T2,當(dāng)用戶確定航站樓后,它會問是出發(fā)還是接人。這就意味著搜狗知音引擎能夠處理更加復(fù)雜的交互邏輯,以及更好的感知用戶語音請求背后的真正需求,這顯然語音交互方面的一大技術(shù)進(jìn)步。
要知道,在兩年前,尤其是蘋果Siri的推出,語音交互作為一種面向未來的交互方向,就備受各大互聯(lián)網(wǎng)公司的重視和看好。包括搜狗、百度、微軟等科技公司都推出了語音助手產(chǎn)品,期待產(chǎn)品能夠作為移動互聯(lián)網(wǎng)的一大入口。不過,現(xiàn)在看來,無論是Siri,還是微軟的小娜,都在用戶短暫的熱捧之后,漸漸沉默。事實(shí)上,這其實(shí)算是第一代的人工智能初級產(chǎn)品,這些產(chǎn)品更多的是扮演著一個(gè)小助手或者秘書的角色,只能夠簡單的處理一些打電話、發(fā)短信、天氣預(yù)報(bào)查詢等等,一旦遇到稍微復(fù)雜的問題,語音助手便無法處理,一般都只好賣萌?;?,這就使得產(chǎn)品的實(shí)用性并不強(qiáng),用戶嘗試使用更多的是抱著娛樂的心態(tài),而并不是真正的剛性需求。
不過,時(shí)隔兩年之后,各大科技公司的語音交互技術(shù)有了顯著的提升。尤其是在這次搜狗發(fā)布的語音交互引擎技術(shù)當(dāng)中更能夠感受到技術(shù)的進(jìn)步之快。根據(jù)了解,目前搜狗的語音交互引擎技術(shù)已經(jīng)應(yīng)用在包括搜狗輸入法、搜狗搜索、搜狗地圖等在內(nèi)的搜狗全線產(chǎn)品當(dāng)中,而根據(jù)搜狗語音交互中心負(fù)責(zé)人王硯峰在現(xiàn)場的演示,運(yùn)用在搜狗搜索、搜狗地圖導(dǎo)航等應(yīng)用上的搜狗語音交互引擎技術(shù),在語音識別率以及多輪語音交互的處理等方面,已經(jīng)顯著領(lǐng)先于競爭對手。
而且,這并不是搜狗第一次展現(xiàn)自己在智能語音方面的技術(shù)能力,以及布局人工智能技術(shù)的決心。在今年6月份的搜狗輸入法十周年上,搜狗CEO王小川就提出了將人工智能定位搜狗輸入法的下一階段戰(zhàn)略發(fā)展的新方向,搜狗CTO楊洪濤則首次透露了搜狗輸入法的快速分享、聰明回復(fù)和妙筆修飾等目前正在研發(fā)的三個(gè)能夠增強(qiáng)用戶表達(dá)能力的人工智能新技術(shù);而在7月份剛剛結(jié)束的奇點(diǎn)創(chuàng)新者峰會上,搜狗CEO王小川更是直接邀請一名現(xiàn)場觀眾上臺直接演示完全通過自然語音來發(fā)送一段短信息,這也體現(xiàn)了搜狗在其人工智能技術(shù)方面的強(qiáng)大自信。
搜狗知音引擎發(fā)布背后,搜狗早有“預(yù)謀”
另一方面,盡管搜狗今年才開始陸續(xù)對外展示自己在人工智能技術(shù)實(shí)力,但顯然搜狗在人工智能的研究和布局并不是剛剛開始。實(shí)際上,搜狗在人工智能領(lǐng)域的研究和布局早已開始,搜狗CTO楊洪濤在知音交互引擎發(fā)布會上就透露:“搜狗從12年開始研發(fā)智能語音技術(shù),并在13年開始進(jìn)行深度學(xué)習(xí),自然交互和知識計(jì)算是搜狗在人工智能領(lǐng)域的兩大戰(zhàn)略方向,目前搜狗在人工智能領(lǐng)域的研發(fā)已經(jīng)全面展開。”
搜狗在人工智能領(lǐng)域的布局不僅起步早,而且與谷歌、百度等搜索引擎公司一樣,屬于天生就擁有人工智能基因的公司。這是因?yàn)樗阉饕鎿碛泻A康乃阉鲾?shù)據(jù),而通過數(shù)據(jù)挖掘之后,便能夠?qū)崿F(xiàn)人工智能的最后一個(gè)階段-機(jī)器深度學(xué)習(xí)。也因如此,我們看到,谷歌不僅推出了圍棋機(jī)器人alphago,更是在更名為Alphabet后,全面轉(zhuǎn)型成為了人工智能公司;而百度同樣將人工智能作為其未來的一大發(fā)展方向。搜狗則在今年第一季度發(fā)布財(cái)報(bào)時(shí),由搜狗CEO王小川首次明確其成為“中國人工智能領(lǐng)域的創(chuàng)新者和領(lǐng)先公司”的決心和野心。而與此相伴隨的則是在人工智能技術(shù)方面的大手筆投入。最具有代表型的便是,今年4月份向清華大學(xué)捐贈1.8億元,與其聯(lián)合成立“清華大學(xué)天工智能計(jì)算研究院”,深入開展人工智能領(lǐng)域的前沿技術(shù)研究。這意味著搜狗開始全面從搜索引擎公司升級成為人工智能公司。
實(shí)際上,搜狗之所以能夠在智能語音技術(shù)方面能夠如此大的突破,除了具有人工智能基因和提早布局之外,更重要的還是要?dú)w功于搜狗在此前十幾年的過程中,積累的數(shù)億用戶以及由此每天產(chǎn)生的海量交互數(shù)據(jù),而這些為機(jī)器學(xué)習(xí)提供了優(yōu)秀的“土壤”,也使得人工智能越來越聰明。搜狗語音交互引擎這一成果取得的背后,顯然離不開日均語音搜索次數(shù)增長超過4倍的搜狗搜索和擁有海量詞庫、日均語音輸入超過1.4億次的搜狗手機(jī)輸入法,正是這兩大產(chǎn)品聯(lián)手讓搜狗智能語音成為目前國內(nèi)語音輸入功能使用量最大的移動手機(jī)產(chǎn)品,而這就意味著搜狗的語音交互技術(shù)有更多的“學(xué)習(xí)”機(jī)會。
不過,盡管搜狗語音交互引擎技術(shù)在當(dāng)下已經(jīng)足夠讓人驚艷,但是離電影《她》當(dāng)中所描述的人工智能場景還有距離。比如《她》當(dāng)中人工智能OS1除了幫助處理工作和生活瑣事之外,還能夠與人類戀愛,并深刻理解人類復(fù)雜的感情。顯然,現(xiàn)在通過自然語言實(shí)現(xiàn)人機(jī)交互只是人工智能的第一步,未來真正實(shí)現(xiàn)擬人化的交流甚至更高級的情感交流才是更高的境界,也因如此,下一次搜狗們能夠推出什么樣的驚艷的產(chǎn)品或技術(shù)就更值得期待。
申請創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!