當前位置:首頁 >  科技 >  IT業(yè)界 >  正文

百度翻譯日活大漲40%:技術十年沉淀,爆發(fā)恰逢其時

 2020-05-11 16:53  來源: A5專欄   我來投稿 撤稿糾錯

  域名預訂/競價,好“米”不錯過

百度翻譯日活迎來新一輪逆勢增長:2020年Q1日活較上一季度環(huán)比增長10%,較去年Q1同比增長40%,這還是在在業(yè)內大盤增長整體放緩的前提下。

同時,百度翻譯目前可支持語種擴充到200個,翻譯方向近4萬個,每天來自世界各地的翻譯請求字符量超過千億,相當于2000部大英百科全書,平均每秒鐘就要翻譯超過1百萬字符。

百度翻譯日活的增長,我們或可將歸結為疫情的推動。

一方面是學生們在家學習、在線學習,有了更多時間通過手機和電腦使用百度翻譯(在校學習期間K12學生不能使用手機);另一方面,疫情背景下,跨過的多語言溝通變得更加重要,跨語言的信息分享變得緊迫,百度翻譯正好滿足了突然集中爆發(fā)的市場需求。

當然,這并不是百度布局翻譯方向十年以來能持續(xù)保持增長的全部,在翻譯之外,百度翻譯還藏著更多“秘密”。

好的翻譯產品,從來不只是“翻得準確”

在過去很長一段時間內,“準確率”是評判一款翻譯產品是否優(yōu)秀的唯一標準,因而所有的翻譯產品都在準確率上“做文章”,從各個維度的“成績”來說明自己在這方面有多厲害,但事實上,隨著越來越多AI技術融入到翻譯產品,其體驗好壞的評判維度變得多元起來。

首先,在翻譯的廣度和速度方面,要不斷擴充與突破。

前者不應只局限在主流語言的互通上,而應尋求更大范圍內的多語言互譯,做到真正意義上的“與世界對話”;后者的最高境界是同聲傳譯。

道理大家都懂,但做起來才知道為什么這兩項能力不是每家都有,其原因就在于太難了。

翻譯廣度牽涉到小語種語言的訓練資源,全球5000多種語言,有一半的語言使用者不到萬人,很大一部分小語種語言的訓練數據只有幾萬條甚至幾千條,難以邁過翻譯的門檻。

翻譯速度牽涉到時間延遲和翻譯質量難以平衡的難題,導致很多翻譯產品的同聲傳譯體驗很難盡人所意。

百度翻譯通過模型上的創(chuàng)新,比如在多語言翻譯技術上,提出基于多任務學習的翻譯模型、多智能體聯(lián)合學習模型等,使多個語言可以共享模型表示,再經過回譯技術進行數據增強,使得1個季度之內,翻譯語種擴充了近7倍,目前支持200種語言互譯,是全球支持語種數量最多的翻譯系統(tǒng)。

在同聲傳譯領域上,百度翻譯又相繼提出了可控時延的翻譯模型、語義單元驅動的上下文感知翻譯模型等,在技術獲得了突破,不但開放了全球首個面向真實場景的中英文同傳數據集,還舉辦了首屆同傳評測,促進本領域技術發(fā)展。

還有一個值得一說的案例,由前沿科技領域頂級科學家參與的iCANX Talks(全球前沿科技直播)主辦方之前嘗試了多款翻譯產品,對翻譯效果都不甚滿意,直到近期才更換為百度翻譯。

其次,翻譯產品的使用場景不應只局限在原始的文本或語音輸入場景中,還應更加豐富和多元。

在技術不斷強化的今天,用戶追求的產品體驗變得更加全面和多樣,如果只有“結果”而沒有細節(jié)豐滿的過程,哪怕有100%的準確率,也因為一個字一個字地輸入而產生干澀的使用感受,市場不會買賬,用戶也不會買單。

百度翻譯除了文本和語音這兩種常規(guī)的輸入翻譯功能之外,其PC文檔翻譯功能支持word、pdf、ppt、excel等多種格式,支持中英、中日、中韓互譯,一鍵上傳,實現不限字數快速翻譯,保留文檔樣式排版,原文譯文對照查看,并支持免費導出,提升文檔翻譯效率。

視頻翻譯領域,百度翻譯攜手人人譯視界聯(lián)合推出了百度視頻翻譯平臺,只需上傳視頻文件并填寫必要信息,即可一站式獲取AI和人工視頻翻譯結果。

除此之外,百度翻譯在拍照翻譯、實景AR翻譯、對話翻譯等場景中通過AI技術的融合持續(xù)在對體驗細節(jié)進行改善。

可以預料的是,來源于百度的AI技術基底,百度翻譯在幫助用戶更好地完成翻譯這件事上,未來或將增加更多創(chuàng)新性的技術體驗。

最后,要從“語言轉換”的狹隘產品認知中跳出。

“語言轉換”是翻譯產品的基本盤,但如果只盯著“語言轉換”,就將翻譯產品劃定了一個局限的牢籠。

借助著AI的能量,翻譯產品的路子可以變得更寬,也更能符合當前所有APP都開始提供關聯(lián)多樣化服務的趨勢。

如何理解?

百度翻譯在業(yè)界首先推出了第四代AI詞典,可以為用戶提供個性化、可互動、智能化、視頻化的“生動”體驗,主要增加了面向學生群體的單詞考頻及題型大數據,單詞講解及情景演繹小視頻,相關知識內容個性化推薦,AI互動跟讀評測,多模態(tài)智能取詞等功能。

例如,產品啟動時,用戶只要完成個人身份及目標(或興趣)的填寫,就能夠體驗到資訊流帶來的專屬定制化推薦。

又例如,在學習場景下,能夠根據用戶的查詞歷史為用戶智能推薦講解視頻;在英語學習十分重要的發(fā)音方面,百度翻譯能夠對用戶的跟讀進行智能評分糾錯。

文章開頭提到,疫情期間讓學生們有了更多使用百度翻譯的機會,如果說這是特殊情況下的被動拉新,那么通過第四代AI詞典的能力,百度翻譯或將進一步強化用戶粘性,從而形成對新增用戶的留存,繼續(xù)在后續(xù)競爭保持領跑。

從更開闊的視野來看,百度翻譯某種程度上可以成為一種生活方式,在產品中內置與翻譯相關的原創(chuàng)內容,在常規(guī)信息流(例如百度APP)之外給出了一個垂直的專業(yè)的信息獲取方式。而與翻譯相關的內容很多,旅行、人文、美食、探索,這些內容更深度也更體現翻譯的生活化信息。

也正是因為在“準確率”之外,百度翻譯豐富了翻譯產品的體驗細節(jié),來自用戶的反饋也是一面倒的好評,百度翻譯APP的下載評論區(qū)中大批網友寫道:“文檔翻譯功能非常好用,把文檔拖進翻譯框里數秒就能翻譯出保留原格式的譯文,節(jié)省了我們數倍的工作時間”、“在學術文章上百度翻譯表現非常出色!”“全篇拍照翻譯厲害到飛起”……

產品體驗是基礎,社會責任是高度

體驗是一款優(yōu)秀翻譯產品的基本盤,但若要夠領跑行業(yè),還在于其通過技術建立起行業(yè)優(yōu)勢之后所釋放出的社會價值。

在目前正在進行的疫情當中,百度翻譯就向公眾積極提供自己的能力,將中國抗疫經驗精準推向全球,以及服務防疫志愿者團隊,開放翻譯醫(yī)療定制服務,體現出一家有責任企業(yè)的社會擔當。

在這里不得不提到百度翻譯的多領域翻譯技術,采用預訓練+精細化訓練、以及領域自適應方法,研發(fā)了領域定制翻譯引擎。

在疫情發(fā)生初期,百度翻譯第一時間免費對外開放了生物醫(yī)藥垂直領域翻譯。深度定制生物醫(yī)藥領域中英互譯模型,截止目前已累計服務上百萬用戶,累計翻譯字符達7.6億。

此外,百度翻譯還緊急成立了專項小組,兩天內開發(fā)搭建并免費開放了醫(yī)療領域定制化翻譯產品,同時為千余名防疫志愿者,定向提供單獨醫(yī)療領域頁面,包括免費的術語定制、圖片翻譯、文檔翻譯等功能。

隨著疫情在全球范圍的蔓延,百度翻譯新增了包括波斯語在內的172個語種,累計上線語種達200個,累計翻譯方向約4萬個,覆蓋全球約180個國家的74億人口,讓疫情信息的共享更加平等和便捷。

為將防疫的“中國經驗”及時分享出去,百度翻譯不僅免費開放覆蓋病毒、疫情、癥狀、防護等多維度重點詞語的多語種疫情詞典,為馳援海外抗疫的中國志愿者提供更準確的翻譯結果,還攜手中新視頻、人人譯視界,為國際疫情嚴峻地區(qū)提供防疫視頻翻譯,讓“中國經驗”在全球抗疫中發(fā)揮更大作用。

我們可以看出,百度翻譯在疫情防控這件事上,不光提供自己的能力,還拉上了生態(tài)伙伴們一同參與,眾人拾柴火焰高,推動的不光是防疫工作,更重要的是在更大的范圍內提高了社會對防疫工作的重視以及對疫情危害的認知。

在提供翻譯服務的對象上,也不僅限于中國的疫情防控工作,而是著眼全球,站在更高的公益高度,也正是因為如此,百度翻譯收到了很多正面反饋:“文檔翻譯功能非常好用,把文檔拖進翻譯框里數秒就能翻譯出保留原格式的譯文,很驚喜,這個細節(jié)節(jié)省了我們數倍的工作時間”、 “在學術文章上百度翻譯表現非常出色!”等。

疫情使得全球人民更加緊密團結起來共同面對困難,也讓百度翻譯獲得了一次極好的歷練機會。正是因為百度翻譯近十年來兢兢業(yè)業(yè)打磨技術,不斷創(chuàng)造滿足用戶需求的產品,提升體驗,才得以在疫情期間獲得口碑傳播,引來日活增加。

通過助力防疫,展示出的是百度翻譯的技術力量與產品情懷。

百度翻譯的發(fā)展史,翻譯產品的三級跳

上文主要分析的是百度翻譯當前所構建起的護城河,然而當我們回頭環(huán)視百度翻譯的發(fā)展歷程,可以發(fā)現正是在百度翻譯的帶動下,翻譯產品這才完成從工具到產品,再到交互服務的三階進化。

1、工具階段:百度利用技術沉淀解決翻譯工具從無到有

早在2010年初,百度就已經組建了機器翻譯的核心研發(fā)團隊,籌備在翻譯領域有所作為。作為全球最大的中文搜索引擎,百度與“語言翻譯”這件事天然親近,僅一年半后的2011年6月,百度就正式推出了web端“百度翻譯”產品。

這個階段,可以認為是百度翻譯利用了百度已有的技術積淀解決翻譯工具從無到有的過程。

此時的百度翻譯,使用的是百度自主研發(fā)的翻譯核心技術,其原理是機器自動從大量語料中學習并自動生成翻譯結果,不經過任何人工整理與編輯。

2、產品階段:與AI融合帶來更多翻譯體驗

隨著移動互聯(lián)網時代到來,把PC端的工具變成移動端的隨身產品成為一時的浪潮,2013年2月百度翻譯發(fā)布Android客戶端(iOS在半個月后發(fā)布),首次在Android平臺上支持離線翻譯應用。

這一過程,是翻譯產品與AI逐步結合,帶來更多翻譯體驗的過程。

百度翻譯背靠百度強大的AI技術,將AI能力與產品逐步融合,既可以認為是領先行業(yè)、獲取競爭優(yōu)勢的舉動,也可以看作在為整個翻譯產品門類與AI融合“探路”。

3、交互服務階段:圍繞用戶、內容、服務的多維度融合

隨著AI滲透的不斷深入,百度翻譯在“翻譯”這件事上的智能化程度大大提高。

比如百度翻譯推出的第四代AI詞典實現了專屬定制化內容推送與服務的融合,甚至還能為用戶的英語學習提供輔助服務。

從以上三個階段跨越看出,行業(yè)與百度翻譯一樣,也在經歷從翻譯得更好,到翻譯得更便利,再到翻譯有更多應用的進化。

如今,百度翻譯的產品形態(tài)已經跨越了傳統(tǒng)翻譯產品古板的工具形象,其使用場景和用戶圈層也在不斷擴大,隨著能力的不斷提升,百度翻譯也正在抹平語言之間的障礙,翻譯產品讓中國與世界的溝通更加順暢的同時,也帶來了見識和眼界的提高。

“與世界更好地溝通”是百度翻譯的愿景。

在過去十年,百度翻譯致力于提升翻譯的精準度廣度和速度、改變翻譯的輸入方式、豐富翻譯產品的應用場景等,在下一個十年,隨著產品形態(tài)的進一步進化,百度翻譯或將在于世界“對話”的同時,講出更多在翻譯之外的故事。

*此內容為【科技向令說】原創(chuàng),未經授權,任何人不得以任何方式使用,包括轉載、摘編、復制或建立鏡像。

文|曾響鈴

來源|科技向令說(xiangling0815)

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關文章

信息推薦