文|曾響鈴
來源|科技向令說
全面戰(zhàn)爭不斷深入的重要表現(xiàn),是局部的深度戰(zhàn)爭。
AI大競賽就是如此。5月15日,百度大腦召開了一場名為“與未來對話”的發(fā)布會,百度大腦“智能對話引擎”及其核心產(chǎn)品UNIT3.0亮相,智能對話在AI競賽中的位置全面提升。
事實上,自從語音、視覺在各個場景應(yīng)用中大放異彩后,AI一直在等待新的爆發(fā)點,現(xiàn)在,創(chuàng)新內(nèi)涵、應(yīng)用前景都十分豐富的智能對話開始接棒,包括百度在內(nèi),諸多大佬級AI平臺都盯上了智能對話。
以百度此次發(fā)布會為標(biāo)志,這個AI新的爆發(fā)點正式起爆,一場AI全面戰(zhàn)爭下的局部深度戰(zhàn)爭打響,而百度憑借AI技術(shù)的先期積累,已經(jīng)占據(jù)有利位置。
不過,對似乎提前鎖定勝局的百度而言,要以行業(yè)“引擎”的姿態(tài)做智能對話,下一步要面臨的挑戰(zhàn)也有不少。
“復(fù)雜系統(tǒng)”下,智能對話更需要開放式行業(yè)平臺
智能對話,從概念上看,其著眼點在“對話”,也即其AI能力擴展到了人機交互的更高層面——像人一樣進行對話式互動,而不只是下達和響應(yīng)被限定的命令。
這給了智能對話提出了更獨特的行業(yè)發(fā)展要求。
1、智能對話是一個“復(fù)雜系統(tǒng)”
目前,智能對話在車載、音箱、客服、機器人領(lǐng)域都有廣泛的應(yīng)用。普通人在網(wǎng)絡(luò)購物、享受服務(wù)的過程中,通過聊天框流暢對話的,很可能就是AI而非客服小姐。
不僅如此,現(xiàn)在的智能對話已經(jīng)能實現(xiàn)語音實時溝通,某些營銷電話的對接,可能就是由智能客服完成,而可以做到消費者渾然不知。
很明顯,這種“自然”對AI來說要求變得更高了。
與語音操作、視覺識別等成熟AI智能產(chǎn)品相比,要實現(xiàn)盡可能自然的對話,智能對話需要在NLP(自然語言處理,“聽見”講了什么詞組、句子)、知識圖譜(即AI懂的知識,只有“懂”才能去“聊”)、語音語義一體化(聽見的音節(jié)能轉(zhuǎn)化成現(xiàn)實的理解,沒有這個就好像不懂外語的聽外語)等方面都有深度積累。
智能語音無法通過簡單的數(shù)據(jù)+模型訓(xùn)練就能形成單個產(chǎn)品,在本質(zhì)上,它是一組技術(shù)和資源的總集成,需要全面的技術(shù)布局和深厚的技術(shù)積累 ,也因此,我們看到,智能語音在語音操作、視覺識別火了很久之后,才“姍姍來遲”迎來爆發(fā)。
2、做好智能對話,三個“池”缺一不可
正因為是“復(fù)雜系統(tǒng)”,所以做好智能對話,其能力需求也十分“立體”。
至少,這三個“池子”的條件平臺方必須具備:
首先,要有豐富的“資源池”。如同嬰兒學(xué)習(xí)對話,需要父母不斷進行輸入,更大量更多樣化的輸入才能讓嬰兒更快地實現(xiàn)語言能力成長。智能對話需要大量語料輸入,并不斷學(xué)習(xí)外界的“知識”。
然后,是強化學(xué)習(xí)能力的“技術(shù)池”。在輸入的基礎(chǔ)上,還得有消化能力,不管是新開發(fā)的AI技術(shù),還是通用AI技術(shù)的借用,智能對話的“復(fù)雜系統(tǒng)”都要求AI有更復(fù)雜的學(xué)習(xí)方式和學(xué)習(xí)過程.
最后,是能夠練手的“實踐池”。只有具備高密度的現(xiàn)實應(yīng)用,智能對話才能從“溫室”走出,適應(yīng)“社會環(huán)境”,沒有真刀真槍上陣,耍再多把式也沒用。
3、BAT級平臺被智能對話天然“預(yù)訂”
很顯然,有大量語料、知識庫,又具備充分的AI技術(shù)積淀,還有自家練手的場景應(yīng)用,全部具備三大“池”資源的只有BAT這樣的平臺級企業(yè),小公司幾乎不具備從零起步構(gòu)建智能對話產(chǎn)品的能力,或者說,投入太過巨大而沒有現(xiàn)實價值。
與簡單要求下的語音、視覺不同,智能對話從一開始就鎖定了BAT級平臺。
而這其中,正是憑借其技術(shù)領(lǐng)先、能力豐富的優(yōu)勢,百度大腦才能在這個爆發(fā)的節(jié)點上,發(fā)布其智能對話引擎;在此基礎(chǔ)上,百度大腦還針對對話系統(tǒng)定制平臺UNIT發(fā)布9大核心特性,形成了全新的對話系統(tǒng)定制平臺UNIT3.0。
相對于有所動作但幅度并不算大的A\T兩家AI平臺,百度智能對話已經(jīng)取得行業(yè)領(lǐng)先。
搜索出身給了百度巨大的先發(fā)優(yōu)勢。不論是天氣、星座、美食、快遞、團購、小說等信息資源,還是人物、地理、歷史體育等問答資源,都讓百度的智能對話有了業(yè)內(nèi)難以企及的語料和知識來源。
此外,AI戰(zhàn)略讓百度為智能對話積累了大量通用技術(shù)基底,以及快速上手的能力;而百度地圖、Apollo、DuerOS、小度機器人等“真實業(yè)務(wù)”又成為百度智能對話的練兵場,積淀了可以轉(zhuǎn)化到生態(tài)伙伴身上的大量預(yù)置技能(可以理解為經(jīng)過了廣泛“實習(xí)”)。
百度大腦為什么敢用“引擎”定義智能對話平臺?
值得一提的是,智能對話玩家們往往發(fā)布都在發(fā)布“XX平臺”、“XX產(chǎn)品”,而百度此次是直接用“引擎”來定義其智能對話平臺。
這固然有拔高競爭維度、強化相對優(yōu)勢的動機,但百度大腦敢這個爆發(fā)的關(guān)鍵節(jié)點用上“引擎”一詞,沒有起碼的實力是不敢這么高調(diào)的。
這里認(rèn)為,百度大腦能提出“引擎”,基于這三個方面的準(zhǔn)備:
1、稟賦上,智能對話平臺早已成型
某種程度上,百度此次的發(fā)布會并不是在發(fā)布一個“新產(chǎn)品”或“新平臺”,而更像是一次過去智能對話能力、產(chǎn)品、平臺、生態(tài)的整合與升級。
在今天正式發(fā)布智能對話引擎及其UNIT3.0之前,百度智能對話對自家產(chǎn)品、生態(tài)伙伴的賦能,已經(jīng)累計實現(xiàn)交互460億+次,而且這次百度大腦推出的UNIT3.0版本,在搭建技能、構(gòu)建知識和整合技能與知識上也做了全面升級,就技能搭建而言,包含預(yù)置技能和自定義技能。其中預(yù)置技能就包括智能問答、設(shè)備控制、影音休閑、生活服務(wù)等58大項,沉淀了全網(wǎng)最全面最優(yōu)質(zhì)的信息類資源。
可以說,百度的智能對話平臺已經(jīng)是全行業(yè)技術(shù)最強、能力最豐富、規(guī)模最大的平臺,這樣一個本身就具備業(yè)務(wù)基礎(chǔ)的平臺,再次升級只能是朝著更高的行業(yè)價值定位方向走。
從而,由“產(chǎn)品”或“平臺”轉(zhuǎn)向“引擎”也就自然而然了,畢竟,AI競賽尤其是平臺型AI之間的生態(tài)競爭,除了技術(shù)和商務(wù)的深入還會在定位上不斷升級維度。
可以預(yù)見,若干時間之后,A/T甚至科大訊飛也會跟上“引擎”的定位。
2、技術(shù)上,已實現(xiàn)快速冷啟動+高精度長尾優(yōu)化
在技術(shù)層面,百度智能對話引擎及其核心產(chǎn)品UNIT3.0有一個長達100多頁的PPT詳盡介紹其各類技術(shù)優(yōu)勢,其技術(shù)儲備的豐富與深度可見一斑(具體見相關(guān)報道)。
但總體看來,這里認(rèn)為,該引擎在技術(shù)上有兩個分階段的優(yōu)勢:部署后的快速冷啟動,運行過程中的高精度長尾優(yōu)化。
說白了,既然是引擎,“加速度”能力是十分重要的。
按百度方面的說法,其UNIT3.0能通過平均77個模板就能實現(xiàn)對話技能的快速冷啟動,對比行業(yè)需要高達800+模板;以地圖導(dǎo)航為例,百度大腦智能對話引擎通過10-100個模板、10-100個樣本就能快速啟動,實現(xiàn)90%的的準(zhǔn)確率。
這意味著,開發(fā)者和企業(yè)幾乎拿來就能滿足基本的需求,部署十分簡單,對環(huán)境要求不高。
而在冷啟動完成之后,智能對話的能力PK就轉(zhuǎn)移到第二個階段:精度的上限能到多少。
90%只是開始,100%只能無限接近。百度智能對話引擎目前已經(jīng)能實現(xiàn)95%的精度(即機器與人對話,95%是成功理解和互動的),注意,這不是普通的指令式語音互動,這個數(shù)字已經(jīng)在智能對話領(lǐng)域已經(jīng)遠(yuǎn)遠(yuǎn)高于多數(shù)玩家。
值得一提的是,精度從冷啟動到向上優(yōu)化的過程,本質(zhì)上是長尾的過程,在頻繁、大量的對話可能性之外,不斷覆蓋那些出現(xiàn)頻率不高的內(nèi)容。 而這一過程仍然需要人力完成數(shù)據(jù)的歸納、標(biāo)注等動作(等于教會機器新鮮詞匯或詞組的現(xiàn)實意義)。
百度大腦智能對話引擎不僅在做AI的事,還幫助這種“人力”的節(jié)省。其DataKit等產(chǎn)品能夠大幅提升樣本生產(chǎn)和標(biāo)注效率,官方稱能把效率提升8倍(從16人/天到2人/天),這一定程度上解決了需要啃食數(shù)據(jù)的AI發(fā)展所自帶的人力瓶頸問題。
3、應(yīng)用上,擁有典型場景并繼承百度開放特質(zhì)
除了具體的數(shù)字,在實現(xiàn)場景上,百度大腦也在百度引以為傲的開放特質(zhì)下,完成了多個典型場景的敷設(shè)。
目前,百度智能對話引擎已經(jīng)在智能客服(中國聯(lián)動、南方電網(wǎng)、東方航空、浦發(fā)銀行、廣州銀行等)、消費電子(家教機、伴學(xué)機器人等)、車聯(lián)網(wǎng)(Apollo、小度車載OS平臺等,涵蓋上汽通過、福特等車企)等核心應(yīng)用領(lǐng)域進行深度應(yīng)用。
這些典型場景一方面是百度大腦智能對話引擎的實力證明,另一方面也在不斷外延的場景實踐中,進一步提升“引擎”的多面適用性,積攢推動更多場景前進的“馬力”。
在BAT甚至整個互聯(lián)網(wǎng)的競爭格局中,百度“最開放”的優(yōu)勢仍將保持下去,更多對智能對話有需求的開發(fā)者、企業(yè)方將能獲得平等、便捷的開放生態(tài)。
百度大腦智能對話生態(tài)這趟車,還會有更多“乘客”,這種預(yù)期下,把平臺定位為“引擎”也就順理成章。
強化“引擎”的生態(tài)推動力,百度大腦未來的三大看點
成為“引擎”不意味著結(jié)束——現(xiàn)實生活中的引擎往往都在追求更強的推力、更低的油耗,智能對話“引擎”也不例外。
要讓“引擎”獲得更強的生態(tài)推動力(也意味著百度獲得更強的競爭力),百度大腦還需要在這三個層面突破升級的關(guān)卡:
1、普惠化:讓高可用性智能對話實現(xiàn)低門檻獲取
AI終將成為全社會的基礎(chǔ)設(shè)施,智能對話的普惠化將是這個龐大基礎(chǔ)設(shè)施體系的一部分。
而技術(shù)的普惠化,往往又與技術(shù)的深度背道而馳。
霍金能夠用最后一片能動的肌肉實現(xiàn)打字、演講,靠的是IBM獨家提供的設(shè)備的強大技術(shù)實力。但這種技術(shù)的造價高昂,只能用于少數(shù)人身上。
智能對話比其他AI技術(shù)更復(fù)雜,決定了它的實現(xiàn)難度更大,所需投入的資源也更多,普惠化面臨巨大的門檻壓力。而高可用性的智能對話,最終目標(biāo)一定是實現(xiàn)“圖靈測試”突破,人人可享用真正智能化的對話機器人,聽起來并不“便宜”。
于是,如何降低門檻就成了關(guān)鍵詞。
百度智能對話引擎的龐大預(yù)置技能,以及快速冷啟動、智能化人工標(biāo)注,都是降低智能對話應(yīng)用門檻的動作。在百度智能客服人工智能3.0的規(guī)劃中,“限定輪次”實現(xiàn)“圖靈測試”被寫入,這說明,在“引擎”階段就盡量實現(xiàn)技術(shù)的簡單易行,將是普惠化的可行方式。
2、定制化:多級生態(tài)模式滿足不同深度的智能對話需求
既然是生態(tài),智能對話繞不過的問題一定有定制化與標(biāo)準(zhǔn)化的協(xié)同問題。
平臺提供的產(chǎn)品往往以標(biāo)準(zhǔn)化內(nèi)容為主,如此在商業(yè)上更易于實現(xiàn)規(guī)?;?;而客戶的需求往往帶有大量的個性化內(nèi)容,這樣才能更好地匹配只屬于自己的用戶/消費者實際。
又要標(biāo)準(zhǔn)化、又要定制化,是“平臺”們面臨的共同難題,也是鉗制生態(tài)規(guī)模的重要因素。
從這個角度看,百度大腦智能生態(tài)引擎在具體技術(shù)內(nèi)容上,提供的一些工具或模塊,就在嘗試解決這類問題。
例如,UNIT3.0內(nèi)嵌一個稱為US Kit的開源中控模塊,能無縫對接UNIT平臺能力,在此基礎(chǔ)上快速生產(chǎn)定制化對話中控,且開源架構(gòu)能夠不斷延展、支持添加各種新能力。
用大白話說,開發(fā)者能夠通過配置各種標(biāo)準(zhǔn)化技能(接入多個對話場景),快速搭建和定制符合自己業(yè)務(wù)場景的對話中控,這種對“標(biāo)準(zhǔn)化”的整合與統(tǒng)一,反過來又現(xiàn)實了屬于開發(fā)者的定制化對話服務(wù)。
3、共贏化:用對話服務(wù)模式的變革推動全產(chǎn)業(yè)升級
為了強調(diào)“對話技術(shù)進入工業(yè)級落地的各項基礎(chǔ)條件已具備”,百度方面用了這樣一些數(shù)據(jù):38%的企業(yè)已應(yīng)用基于智能對話的系統(tǒng);44%的企業(yè)計劃在2年內(nèi)使用智能對話;83.3%企業(yè)認(rèn)為智能對話能有效降低運營成本;78.6%的企業(yè)認(rèn)可智能對話能改善客戶體驗……
事實上,換個角度看這些數(shù)據(jù):對話服務(wù)方式的改變,使得智能對話引擎某種程度上成為產(chǎn)業(yè)升級浪潮的助力,而不再僅僅是平臺、企業(yè)、開發(fā)者之間的AI商業(yè)互動。
為產(chǎn)業(yè)中某企業(yè)服務(wù)的智能對話引擎,在事實上加速著企業(yè)(并通過企業(yè)改變產(chǎn)業(yè)本身)與互聯(lián)網(wǎng)信息時代融合的速度,在這個過程中,由于客戶體驗的改變、信息溝通反饋的便捷,企業(yè)以及產(chǎn)業(yè)的悶頭干活的發(fā)展方式也將被改變。
而這,正是產(chǎn)業(yè)升級的內(nèi)容。
智能對應(yīng)引擎所形成的行業(yè)生態(tài)從客服等職能切入,但溝通方式改變對許多產(chǎn)業(yè)的影響卻是整體的。百度大腦的智能對話引擎,不僅僅在形成百度自己的AI垂直生態(tài),也在用對話服務(wù)模式的變革推動全產(chǎn)業(yè)升級。
*此內(nèi)容為【科技向令說】原創(chuàng),未經(jīng)授權(quán),任何人不得以任何方式使用,包括轉(zhuǎn)載、摘編、復(fù)制或建立鏡像。
【完】
曾響鈴
1鈦媒體、品途、人人都是產(chǎn)品經(jīng)理等多家創(chuàng)投、科技網(wǎng)站年度十大作者;
2虎嘯獎高級評委;
3作家:【移動互聯(lián)網(wǎng)+ 新常態(tài)下的商業(yè)機會】等暢銷書作者;
4《商界》《商界評論》《銷售與市場》等近十家雜志撰稿人;
5鈦媒體、界面、虎嗅等近80家專欄作者;
6“腦藝人”(腦力手藝人)概念提出者,現(xiàn)演變?yōu)?ldquo;自媒體”,成為一個行業(yè)。
7現(xiàn)為“今日頭條問答簽約作者”、多家科技智能公司傳播顧問。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!
雖然我國汽車芯片行業(yè)還處在發(fā)展初期,但已經(jīng)迸發(fā)出無限潛力。一方面,智能汽車的發(fā)展不斷帶動需求增長;另一方面,政策引導(dǎo)下,汽車芯片企業(yè)持續(xù)搶占高地。對此,在7月5日-7日舉辦的2023年中國汽車論壇上,中國汽車工業(yè)協(xié)會副秘書長李邵華就做出表示,“中國將成為未來汽車芯片發(fā)展的集聚地”。車規(guī)芯片行業(yè)近日的
2023世界人工智能大會將于7月6日至8日在上海舉辦。云天勵飛將在大會上展示自主設(shè)計開發(fā)的新一代邊緣計算芯片DeepEdge10系列SoC芯片,并公布“天書”大模型的最新動態(tài)。歡迎蒞臨上海世博展覽館H1-C801展臺參觀交流!同時,云天勵飛也將與中國電子、中國信通院、華為等合作伙伴,在WAIC的舞臺
近日,酷學(xué)院智能產(chǎn)品發(fā)布會在深圳閃亮登場。近200位現(xiàn)場觀眾和近萬人次在線觀看,共同見證了這一激動人心的時刻。發(fā)布會上,酷學(xué)院引領(lǐng)大家探索企業(yè)培訓(xùn)學(xué)習(xí)和人才發(fā)展領(lǐng)域的新高度,并揭幕其全新的產(chǎn)品智能升級和突破。酷學(xué)院產(chǎn)品負(fù)責(zé)人徐晨通過形象生動、邏輯嚴(yán)謹(jǐn)?shù)闹v述,揭曉了全新的智能企業(yè)培訓(xùn)和人才發(fā)展平臺,以
隨著人工智能技術(shù)的快速發(fā)展,各行各業(yè)都受到了深刻影響,特別是中小學(xué)人工智能教育的普及,已經(jīng)成為當(dāng)今不可忽視的重要課程。ChatGPT等人工智能技術(shù)的出現(xiàn),讓我們看到了人工智能將成為未來推動科技跨越發(fā)展、生產(chǎn)力整體躍升的重要驅(qū)動力量之一。在這個背景下,中小學(xué)教育已經(jīng)將人工智能作為重要學(xué)習(xí)內(nèi)容,并將科技
蘋果16弄了兩個版本,一個是專門給中國人用的,準(zhǔn)備用百度的AI,還要交錢。第二個是全世界都可以用的,用了ChatGPT,包括臺灣、香港、澳門都可以用。以后都這樣了。好,問題就出在這,蘋果和百度的合作出現(xiàn)問題了,新聞連起來看,才能明白其中含義。新聞一:蘋果正在和騰訊、字節(jié)初步接洽,考慮將二者的AI模型
“技術(shù)日新月異,人類生活方式正在快速轉(zhuǎn)變,這一切給人類歷史帶來了一系列不可思議的奇點。我們曾經(jīng)熟悉的一切,都開始變得陌生?!庇嬎銠C之父約翰·馮·諾依曼曾這樣說到。
“人工智能的商業(yè)模式,是要創(chuàng)造一個市場,而非一個算法”。這是世界AI泰斗MichaelI.Jordan的觀點。而當(dāng)前的全球AI市場,占據(jù)主導(dǎo)地位的中美雙方,卻也走出了兩條截然不同的技術(shù)路徑,前者執(zhí)著于前沿技術(shù)的探索,后者則發(fā)力應(yīng)用優(yōu)化和商業(yè)化落地。南轅北轍的兩個方向,或許已經(jīng)無法直接進行排位先后、優(yōu)
智能體進化發(fā)展了一年,現(xiàn)在的RPAAgent迭代到什么程度了?從實在智能最新發(fā)布的實在Agent7.0,看RPAAgent的迭代升級抓取豆瓣信息、自己制作PPT,這款A(yù)IAgent真的實現(xiàn)了流程全自動化AIAgent構(gòu)建到執(zhí)行全自動化,持續(xù)進化RPAAgent再次降低智能體應(yīng)用門檻實在智能重磅發(fā)布實
崔大寶|節(jié)點財經(jīng)創(chuàng)始人進入2024年,大模型似乎有熄火之勢:資本市場,與之關(guān)聯(lián)的概念炒不動了,英偉達股價動輒暴跌重挫,引發(fā)“泡沫戳破”的擔(dān)憂;消費市場,BATH們的推新活動少了,產(chǎn)品更新迭代的速度慢了,民眾的關(guān)注度降了……熱鬧的大概只剩下兩場酣仗:自5月15日字節(jié)跳動宣布“以厘計費”,打響國內(nèi)大模型
文|智能相對論作者|陳泊丞好消息!你心心念念的事業(yè)單位發(fā)錄取公告了!壞消息!他們沒錄你,錄了個數(shù)字人。圖片來源網(wǎng)絡(luò)隨著數(shù)字人技術(shù)的突破,越來越多的傳統(tǒng)企業(yè)和機構(gòu)開始用上了“數(shù)字員工”。甚至很多中國人心心念念的“鐵飯碗”,也被這些數(shù)字人給捧上了。數(shù)字人捧上了“鐵飯碗”簡單翻看一下全國各地事業(yè)單位的“錄
黑芝麻智能敲鐘后,港交所門口又有一些智駕芯片企業(yè)引發(fā)關(guān)注。據(jù)悉,近日地平線已通過中國證監(jiān)會IPO備案,擬發(fā)行不超過11.5億股境外上市普通股并在香港聯(lián)合交易所上市,預(yù)計籌集約5億美元資金。從天眼查可以了解到,該公司成立于2015年,是一家乘用車高級輔助駕駛(ADAS)和高階自動駕駛(AD)解決方案供
8月21日,萬眾矚目的2024世界機器人大會暨博覽會在北京亦創(chuàng)國際會展中心盛大開幕。這場為期5天,集“展覽”“論壇”“賽事”于一體的機器人盛會,反映了當(dāng)下機器人領(lǐng)域的繁榮生態(tài)。據(jù)官方統(tǒng)計數(shù)據(jù),今年現(xiàn)場逛展觀眾高達25萬人次,比去年增加25%。機器人行業(yè)有多火?看看2024世界機器人大會火爆程度便可知