作者 | 曾響鈴
文 | 響鈴說
幾秒鐘寫出了一篇歡迎詞;
小說人物亂入現(xiàn)實,快速創(chuàng)作不重樣的故事;
鼠標一點,一封英文工作溝通郵件撰寫完成;
準確解出數(shù)學應(yīng)用題,還給出解題步驟;
甚至還能理解人類情感,認識同一個詞語在不同場合下的含義……
在一片掌聲中,不久前的科大訊飛“星火”認知大模型發(fā)布會,以現(xiàn)場實機的方式,第一次向業(yè)界展示了中國的大模型能力所能達到的程度。
科大訊飛董事長劉慶峰稱,在文本生成和數(shù)學能力(一定程度代表通用認知大模型的智慧水平)上,星火認知大模型已經(jīng)國內(nèi)顯著領(lǐng)先,且相比ChatGPT也具有一定優(yōu)勢;在語言理解和知識問答方面也達到接近ChatGPT水平,處于國內(nèi)領(lǐng)先水平。
大模型的能力無疑是令人驚嘆的。OpenAI的CEO奧特曼曾經(jīng)說,數(shù)據(jù)量大了,模型大了,就突然就出現(xiàn)了令人驚喜的結(jié)果,他也不知道為什么。
劉慶峰在接受采訪時表示,星火對一些問題的回復(fù),“不知道它怎么懂的”。
這一類現(xiàn)象,正在接近人工智能領(lǐng)域期待已久的“智慧涌現(xiàn)”(Emergent Intelligence)。
如劉慶峰所言,統(tǒng)一的深度神經(jīng)網(wǎng)絡(luò)大模型在輸入多元多模態(tài)的數(shù)據(jù)后,可以就所有非特定領(lǐng)域“觸類旁通”,而不需要專門以特定的問題去訓練。
智慧涌現(xiàn)從根本上告別了預(yù)設(shè)認知的“知識圖譜”AI模式,在走向真正的認知智能。
在國內(nèi)大模型遍地開花的大背景下,“智慧涌現(xiàn)”將成為共同的愿景。
而誰才能最先做到“智慧涌現(xiàn)”?
越來越多現(xiàn)實表明,作為一種技術(shù)創(chuàng)新,大模型也需要和其他技術(shù)創(chuàng)新一樣,實現(xiàn)從技術(shù)能力到生態(tài)伙伴到產(chǎn)業(yè)應(yīng)用的打通。
如劉慶峰所言,是要找準“最解決社會剛需而又有市場規(guī)模能夠自我造血的點”,不斷反哺技術(shù)創(chuàng)新提升,最終要實現(xiàn)“良性循環(huán)”。
只有良性循環(huán),才能不斷強化和提升,實現(xiàn)智慧涌現(xiàn)。
反過來,拆解當下大模型實現(xiàn)良性循環(huán)的幾個要求,智慧涌現(xiàn)的實現(xiàn)也就自然而然了。
能力有鏈條,才能真正“智慧”
“星火”發(fā)布了七大能力,文本生成、語言理解、知識問答、邏輯推理、數(shù)學能力、代碼能力、多模態(tài)。
這是通用人工智能的七大維度,很多廠商也基本上都跟隨chatGPT進行了布局。
但科大訊飛對它們的各自認識卻并不相同。
在“星火”發(fā)布會上,劉慶峰表示,5月份星火還要進行一次迭代,增加更多的插件機制。
“有理解能力就可以做很多插件機制。”
在劉慶峰看來,“自然語言理解水平到位,才能最后讓大模型真的作為一個工具,能夠把各種插件充分的調(diào)閱起來”。
也即,在科大訊飛的布局中,語言理解能力不僅僅是在發(fā)布會現(xiàn)場讓觀眾發(fā)出驚呼,更重要的是它的強化,能夠讓大模型整體的能力“接駁”到不同的場景中去,API能夠理解復(fù)雜的指令、給出切中需求的結(jié)果。
所以,語言理解能力對友商的領(lǐng)先,也被劉慶峰視作“獨特優(yōu)勢”。
與此類似的,還有科大訊飛宣布“星火”6月份將有一次重大升級,其中數(shù)學理解要強化。
這背后,是科大訊飛認為“數(shù)學能力是代表大模型聰明程度”,“數(shù)學理解在智慧涌現(xiàn)中能夠幫助到其他能力”,因此,在評價對國內(nèi)競品有代差級優(yōu)勢后,還不滿意,還必須針對性強化。
此外,知識問答能力,也在發(fā)布會現(xiàn)場被劉慶峰透露要具體到垂直場景中,例如可以在醫(yī)療領(lǐng)域發(fā)揮價值。
可見,科大訊飛雖然發(fā)布了7大能力,但內(nèi)在不同的能力卻有自己的定位,形成了鏈條,有針對性的優(yōu)化調(diào)整。
對大模型而言,只有這樣,才能做到真正“智慧”,并讓教育、辦公、汽車等大多數(shù)場景和個體感受到“智慧”。
當然,完成七大能力的構(gòu)建,尤其是針對性的能力提升,并非只有一個宏觀認識就足夠了,還離不開長期的技術(shù)儲備。
早在2011年,科大訊飛就獲準成立語音及語言信息處理國家工程實驗室,2017年,科大訊飛又成立認知智能國家重點實驗室,一系列技術(shù)創(chuàng)新和進步不斷積累。
例如,2015年語音轉(zhuǎn)寫首次超過人類速記員、2017年通過國家執(zhí)業(yè)醫(yī)師資格考試、2019年SQuAD機器閱讀理解全球首次超過人類平均水平、2022年OpenBookQA 科學知識推理單模型超過人類平均水平,等等。
這些,成為“星火”七大能力的基礎(chǔ),是科大訊飛2022年年底啟動“1+N”(1個通用認知智能大模型、N個領(lǐng)域落地)認知大模型專項攻關(guān)的前提,也是“星火”能夠在語言理解等特定能力上有獨特優(yōu)勢的保障。
離場景更近,才能快速“涌現(xiàn)”
GPT-4發(fā)布后,并沒有公布其參數(shù)量,這被視為走向商業(yè)化的準備。
畢竟,截止4月,微軟向OpenAI已投入130億美元,2023年,OpenAI預(yù)期還要實現(xiàn)數(shù)億美元的營收,來開啟“回報”的進程。
不論什么大模型,最終都必須走向商用、服務(wù)企業(yè),創(chuàng)造專業(yè)價值,才能實現(xiàn)發(fā)展運營的良性循環(huán)——自我造血,是最大的良性循環(huán)。
實際上,“智慧涌現(xiàn)”,也并不僅僅指的是AI能力的觸類旁通,更重要的還有各個場景下AI應(yīng)用所產(chǎn)生的驚人效果。
要實現(xiàn)這種“涌現(xiàn)”,就必須加速AI能力向產(chǎn)業(yè)的落地。
包月、按量收費、VIP一對一……不管是什么樣的商業(yè)模式,大模型背后的廠商所擁有的場景積累,決定了“涌現(xiàn)”的速度和深度。這是大廠的“基因優(yōu)勢”,可以直接結(jié)合過去一直在進行智能化場景業(yè)務(wù)來推動chatBOT能力落地。
典型的,還有“星火”發(fā)布的同時,科大訊飛就在現(xiàn)場同時發(fā)布了教育、辦公、汽車、數(shù)字員工四大行業(yè)應(yīng)用。
從目前的市場狀況看,大模型的場景“涌現(xiàn)”,廠商能夠在三個方面展現(xiàn)過去業(yè)務(wù)積累的價值。
1、離產(chǎn)品最近
很多過去就帶有智能化能力的硬件和服務(wù),可以直接接入大模型來實現(xiàn)能力的升維。
例如,“星火”接入科大訊飛AI學習機,讓該產(chǎn)品實現(xiàn)中英文作文類人批改,;另外,訊飛智能辦公本產(chǎn)品也直接受益于大模型,可以實現(xiàn)會議紀要的高效、精準、扼要整理,以及語音轉(zhuǎn)寫文稿的規(guī)整化。
目前,訊飛智能錄音筆、訊飛智能麥克風等辦公產(chǎn)品也在接入“星火”。
2、離產(chǎn)業(yè)最近
To B的智能化轉(zhuǎn)型服務(wù)原本就是AI的主戰(zhàn)場,現(xiàn)在可以直接引入大模型。
“星火”接入智能座艙,與科大訊飛為數(shù)千個車型提供智能語音交互服務(wù)有直接關(guān)系,現(xiàn)在這種交互變得更自由、更擬人化。此外,“大模型+數(shù)字員工”,在企業(yè)招聘、營銷售后等方面能為企業(yè)提供更擬人甚至超越人的工作能力。
正如科大訊飛計劃在醫(yī)療、城市、政法、工業(yè)等行業(yè)引入大模型,To B市場上已有的智能化服務(wù)都有接入大模型的可能性。
3、離生態(tài)最近
將已有的資源接入大模型,大廠們還需要更多伙伴的協(xié)同。
劉慶峰在接受采訪時表示,“一定要靠生態(tài)共榮來做”,他透露,有首批來自36個行業(yè)的3000余家企業(yè)開發(fā)者將接入星火大模型。發(fā)布會上,科大訊飛還啟動了“2023 科大訊飛AI星火營生態(tài)計劃”。
這背后,也離不開科大訊飛已有的、來自千行百業(yè)的400多萬開發(fā)者生態(tài)。
大模型的落地,不是只有把技術(shù)接入產(chǎn)品、服務(wù)賣給客戶,沒有生態(tài)運營能力,也很難“循環(huán)”起來。
力量成建制,才能持續(xù)進步
有鏈條定位的能力,離場景更近,“良性循環(huán)”就能夠滾起來。
而這種滾動能夠不斷持續(xù)下去,還需要廠商本身在戰(zhàn)略、戰(zhàn)術(shù)、團隊等方面建制化力量。
這不僅是對加入大模型競逐的創(chuàng)業(yè)團隊提出的嚴峻要求,也對大廠管理運營能力提出了要求。
草臺班子,或者沒法力出一孔推出新業(yè)務(wù)的大廠,做不到良性循環(huán)的持續(xù)。
劉慶峰的信心,很大一部分也來自這樣的成建制力量。
在戰(zhàn)略定位上,科大訊飛承載著認知智能唯一的全國重點實驗室,“星火”的出色表現(xiàn),某種程度上也是國家層面的幸事。
在戰(zhàn)術(shù)上,科大訊飛沒有悶頭做技術(shù)和產(chǎn)品,而是以認知智能全國重點實驗室會同中科院人工智能產(chǎn)學研創(chuàng)新聯(lián)盟、長三角人工智能產(chǎn)業(yè)鏈聯(lián)盟等業(yè)界權(quán)威力量,面向整個行業(yè)推出了通用認知智能大模型評測體系。
通過七個方面481個維度的分解,通用人工智能能力的評價有了一個相對更客觀的評價標準。
一方面,在大量跟風入局的大背景下,技術(shù)的好壞不再憑借廠商各自的品牌宣傳。
科大訊飛就試圖用這套體系來客觀講述其大模型各項能力的水平。
例如,在英文的郵件、廣告文案、招牌廣告、新聞通告等事項上,5分制下,ChatGPT為4.48分,而“星火”達到了4.29分,領(lǐng)先國內(nèi)同行,與ChatGPT十分接近。
這就使得市面上那種單一問題評價的方式(不管是官方的,還是測試者的體驗報告)被摒棄,體系化的方式更令人信服。
一些行業(yè)亂象或也將被肅清。
另一方面,評測標準反過來也是指導(dǎo)標準,能夠幫助更多入局的廠商更好地優(yōu)化自己的技術(shù)和服務(wù)。
正如劉慶峰在采訪中所言,“一方面對自己的研究做到什么程度是一個指導(dǎo),指導(dǎo)我應(yīng)該怎么做得更好,每一個階段的版本進步在哪,有哪些缺點;另外一個也是用它來真的來看,根據(jù)不同的應(yīng)用,應(yīng)該關(guān)注哪些能力。”
評測體系的出現(xiàn),一定程度上表現(xiàn)出全球大模型激烈競爭下,國內(nèi)行業(yè)領(lǐng)頭羊所承擔的行業(yè)職責。
在團隊上,科大訊飛“星火”核心團隊目前有200人,大部分都是85后90后的年輕團隊,每個領(lǐng)域分了8個子項目,每個課題的領(lǐng)軍人物都在這個領(lǐng)域中做了8~10年。
而200人之外,劉慶峰介紹,還有支持團隊1000余人,以及更外圈10萬人的兼職數(shù)據(jù)標記團隊。
這個整齊有序的團隊體系建設(shè),是“星火”各項能力能夠不斷進步、攻克大模型相關(guān)難題的保障。
戰(zhàn)略、戰(zhàn)術(shù)、團隊,一整套建制化力量下來,科大訊飛還將在6月9號、8月15號和10月24號發(fā)布迭代版本。
對更多想要入局或者已經(jīng)入局大模型的玩家而言,科大訊飛的案例表明,對技術(shù)有認知、對場景有沉淀,還能做好操盤,才能實現(xiàn)持續(xù)的“良性循環(huán)”。
光有技術(shù)與熱血,在大模型這里,不足以實現(xiàn)“智慧涌現(xiàn)”。
*本文圖片均來源于網(wǎng)絡(luò)
*此內(nèi)容為【響鈴說】原創(chuàng),未經(jīng)授權(quán),任何人不得以任何方式使用,包括轉(zhuǎn)載、摘編、復(fù)制或建立鏡像。
#響鈴說 Focusing on企業(yè)數(shù)字化與產(chǎn)業(yè)智能化升級,這是關(guān)注一切與創(chuàng)業(yè)、產(chǎn)業(yè)和商業(yè)相關(guān)的降本增效新技術(shù)、新模式、新生態(tài) NO.339深度解讀
【完】
曾響鈴
1鈦媒體、品途、人人都是產(chǎn)品經(jīng)理等多家創(chuàng)投、科技網(wǎng)站年度十大作者;
2 虎嘯獎評委;
3 作家:【移動互聯(lián)網(wǎng)+ 新常態(tài)下的商業(yè)機會】等暢銷書作者;
4 《中國經(jīng)營報》《商界》《商界評論》《銷售與市場》等近十家報刊、雜志特約評論員;
5 鈦媒體、36kr、虎嗅、界面、澎湃新聞等近80家專欄作者;
6 “腦藝人”(腦力手藝人)概念提出者,現(xiàn)演變?yōu)?ldquo;自媒體”,成為一個行業(yè);
7 騰訊全媒派榮譽導(dǎo)師、多家科技智能公司傳播顧問。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!