2023年上半年,在AIGC的相關投資中,多模態(tài)與跨模態(tài)項目出現(xiàn)明顯的結構性熱潮,無非都是看到了數(shù)字人的發(fā)展?jié)摿蛻脠鼍?。作為互?lián)網(wǎng)、人工智能巨頭微軟,自然不能放棄這塊希望的田野。
7月24日,微軟與小冰聯(lián)合宣布,將為亞洲企業(yè)客戶推出全新的AI數(shù)字員工解決方案,旨在進一步提高企業(yè)的工作效率和生產(chǎn)力。不過,這到底是世紀聯(lián)手的科技大創(chuàng)新,還是依然在做換湯不換藥的人工智能客服?
01大模型下一波落地數(shù)字人,微軟搶占數(shù)字員工市場
艾瑞咨詢《2023年中國AIGC產(chǎn)業(yè)全景報告》的數(shù)據(jù)顯示,2021年至2023年7月期間,AIGC賽道共發(fā)生280筆投融資,展現(xiàn)了高熱度與高成長性。從產(chǎn)業(yè)細分維度來看,模型層創(chuàng)業(yè)受到ChatGPT影響,在2023年集中涌現(xiàn)。在獲投的應用與模型層創(chuàng)業(yè)項目中,相比單一模態(tài),多模態(tài)和跨模態(tài)的應用前景更加為資本所看好,而跨模態(tài)與多模態(tài)的投資相比,又明顯勝出許多,報告顯示,跨模態(tài)熱度分布比例達到42.4%。所以目前,數(shù)字人為主的跨模態(tài)投資在模型層是最受追捧的存在。
(2021-2023年AIGC產(chǎn)業(yè)鏈各環(huán)節(jié)各模態(tài)融資熱度情況)
基于市場需求火熱,微軟搶占數(shù)字員工市場并非偶然。同時,小冰的提前布局和技術優(yōu)勢大有超越市場平均水平的勢頭。
從投融資輪次維度分析,當前國內(nèi)70%左右的項目仍處于A輪及以前階段,同時有高達14.6%的比例屬于股權、戰(zhàn)略融資。這說明,雖然賽道的戰(zhàn)略價值已被公認,但實則還處于起步期。而在獲投的170家公司中,獲投3次及以上公司約占17%。同一標的的高頻融資,從企業(yè)需求側反應了AIGC前期創(chuàng)業(yè)所需的大量資金支持,從資方供給側也表明優(yōu)質創(chuàng)業(yè)項目仍舊非常稀缺的現(xiàn)狀。
(2021-2023年AIGC產(chǎn)業(yè)總體及各公司融資輪次分布情況)
這樣的市場背景之下,小冰已有的研究和實踐基礎就顯得較為超前。2014年,小冰團隊率先在中國市場推出虛擬人業(yè)務,之后于2015年推出日本小冰。而如今,小冰歷經(jīng)數(shù)字人技術創(chuàng)新的幾乎全過程,已經(jīng)更新到了第九代,并且有了很多代表性的作品,比如被稱為“虛擬人技術天花板”的財經(jīng)AI主播N小黑、參與2022北京冬奧會的人工智能裁判與教練系統(tǒng)“觀君”等等。小冰引以為傲的自研深度神經(jīng)網(wǎng)絡渲染技術也讓其暫時領先行業(yè)。
由此來看,微軟聯(lián)合親女兒小冰,有突破“傻瓜客服”的希望和潛質。
但微軟“小冰”經(jīng)歷了孵化、被分拆、再合作、獨立發(fā)展的幾個階段,已經(jīng)積累了獨特的能力和基礎,成為了數(shù)字人孵化領域的獨角獸。那么為什么又再次合作微軟?讓我們回顧以下微軟的官宣文案:
“小冰將面向亞洲地區(qū)企業(yè)客戶,推出基于微軟國際版Azure新一代AI數(shù)字員工解決方案,雙方將共同推進解決方案的市場普及?;谖④泧H版Azure與小冰公司的X-CoTA技術,該解決方案可為客戶實現(xiàn)擬人的對話式人工智能交互、廣泛的邏輯思維能力、多模態(tài)生成能力與領城專業(yè)知識,有助于進一步提高AI數(shù)字員工效能。”
可以看出,此次合作事實上是微軟智能服務平臺與小冰數(shù)字人技術的合作,國際版Azure提供全球基礎結構、端到端定制支持和SaaS平臺的各種工具,服務企業(yè)在定制小冰數(shù)字人之后的應用環(huán)節(jié),以微軟擁有的各類強大資源為數(shù)字員工的銷售背書。
(國際版Azure官網(wǎng)披露解決方案)
除平臺和服務的支持保障穩(wěn)定性外,小冰加微軟的組合在技術上也很有優(yōu)勢。小冰最新推出的小冰鏈(X-CoTA)技術,創(chuàng)新了一種根本區(qū)別于大模型的小模型鏈式結構,不同的小模型可以負責不同的任務,如語音識別、自然語言理解、情感分析、知識圖譜等,通過聯(lián)合,可以實現(xiàn)更加復雜和細致的對話生成,根本提升了智能系統(tǒng)的“情商”。這也是傳統(tǒng)人工智能客服和AI數(shù)字員工的根本差別。
相對于曾經(jīng)只擁有少量固定知識儲備的“傻瓜客服”,X-CoTA技術加Azure平臺的組合使數(shù)字員工具有了自主思考和開放式搜集信息的能力,這就使得數(shù)字人在擁有逼真外形的基礎上,可以獨立解決問題。
總體來看,微軟與小冰的攜手可以稱得上是強強聯(lián)合,但相關技術和產(chǎn)品真正應用到市場端,能否達到預期效果,還尚未可知,這主要是因為推廣方面面臨諸多挑戰(zhàn)。
02小冰數(shù)字人造出來容易,推廣起來難
此次和微軟再合作,等待小冰突破的不僅是技術層面的問題,更有AI技術和AI員工不斷融入發(fā)展和應用中必然會帶來的倫理、法律、經(jīng)濟、社會等一系列問題。
從長遠來看,數(shù)字員工必然會帶來人力資源結構的變化,推廣過程中也將遭受多方力量的博弈,前途如何,還未可知。人機協(xié)同對于生產(chǎn)力來說,到底是解放還是取代,還有待現(xiàn)實的檢驗。
小冰CEO李笛就曾經(jīng)表示,“大模型(及其他模型)的安全性和倫理仍是至關重要的考量因素”。因此,盡管國內(nèi)市場非?;鸨?,但小冰團隊不會為了“秀肌肉”而貿(mào)然放出各種不安全的產(chǎn)品,這次的小冰鏈可以說是唯一的例外。所以,即使技術有了新的突破,安全性和社會影響也會繼續(xù)制約數(shù)字員工的發(fā)展和普及。
微軟表示,AI員工是人而非工具,數(shù)字人回歸人性,必定會推動新組織關系的形成。目前來看,亞洲人力資源市場上對于AI代替人類崗位的惶恐還未擴散,但數(shù)字員工的潛力總有一天會爆發(fā),沒有準備的個人或企業(yè)都將以很快的速度被市場淘汰。再加上,新的就業(yè)崗位并沒有被提供,新的藍海也沒有被廣泛開發(fā),數(shù)字員工的普及或被即將到來的失業(yè)焦慮與可能的社會動蕩強力制衡。除此之外,企業(yè)數(shù)字化轉型還涉及到相關組織架構的重建,對所引發(fā)的問題也需要思考和解決。
此外,內(nèi)容能力仍是虛擬數(shù)字人發(fā)展的核心驅動力。市場對于數(shù)字人的期待絕不僅僅是精準的形象克隆,做一個漂亮的皮套人,而是期待它有著更加自主的內(nèi)容創(chuàng)新能力,小冰在此還有待提升。
而對于數(shù)字人實際應用價值,應該結合整個AIGC大背景來看待。
一方面,AIGC將革新數(shù)字內(nèi)容產(chǎn)業(yè)的發(fā)展范式,提升內(nèi)容生產(chǎn)的價值和影響力。另一方面,AIGC將極大地激活數(shù)據(jù)要素潛能,促進數(shù)字經(jīng)濟與實體經(jīng)濟的深度融合,數(shù)字產(chǎn)業(yè)化和產(chǎn)業(yè)數(shù)字化的范圍將持續(xù)擴大交融。AIGC對生產(chǎn)力的革新,將一定程度引領產(chǎn)業(yè)涌進從IT化、互聯(lián)網(wǎng)化到智能化的第三階段數(shù)實融合浪潮。
不過,盡管數(shù)字員工的前景光明、變革廣大,但也必然要以技術成熟度和內(nèi)容的生成、創(chuàng)新為基礎。雖然小冰以創(chuàng)作詩歌和作曲吸引了眾多用戶的認可,但事實上,它的訓練數(shù)據(jù)集還相對較小,這使得語言理解和內(nèi)容生成能力受到了嚴重的限制。具體來說,由于沒有足夠的數(shù)據(jù)來進行學習和訓練,微軟小冰的語言模型目前很難識別和理解一些復雜的語言結構和表達方式。此外,小冰的對話生成算法仍是傳統(tǒng)的規(guī)則和模板匹配方法,不能和更加先進的transformer神經(jīng)網(wǎng)絡模型相媲美。
多模態(tài)技術是文本、圖像、語音等模態(tài)之間的轉換與融合,技術難度最大,當前成熟度水平較低,僅在文-圖,文-語音等領域有達到商用水平的表現(xiàn)。但目前來看,多模態(tài)技術是AIGC領域未來預期影響力最大的技術。
(AIGC技術成熟度示意圖,數(shù)據(jù)來源:艾瑞咨詢)
小冰生于C端,走向B端,現(xiàn)在又重回C端,是內(nèi)容創(chuàng)作賦能個體用戶的必然趨勢也是交互能力、內(nèi)容生成能力的必然考驗。可以預見,AIGC進一步下放內(nèi)容創(chuàng)作權,極大激發(fā)用戶創(chuàng)作熱情,加速內(nèi)容裂變,并帶來一系列AI-Native的新生機會。但國內(nèi)用戶在SaaS服務上仍表現(xiàn)出較低的付費意愿和購買力,如何聚集流量、讓用戶從嘗鮮行為轉為深入重復使用且滿足強監(jiān)管要求仍然是目前C端運營的重點、難點。
而且要注意的是,微軟此次合作小冰要拿下的是亞洲市場,產(chǎn)品推廣難度甚至將大過產(chǎn)品開發(fā)。
如上文所述,AIGC將首先從內(nèi)容生產(chǎn)與交互方式的層面改變企業(yè)數(shù)字化產(chǎn)品服務。數(shù)字員工在B端應用推廣與企業(yè)自身的數(shù)據(jù)基礎、上云進程、數(shù)字化進度等基礎條件都息息相關。而目前,亞洲大部分企業(yè)的數(shù)字化程度還需進一步提升,遠未達到能夠與虛擬數(shù)字人相輔相成的程度。整體來說,數(shù)字員工目前更像是基礎設施,數(shù)字化程度較高的試點企業(yè)率先運營,距離普及推廣還需要等待各B端企業(yè)數(shù)字化、智能化素質的提升。
其次,亞洲國家目前對數(shù)字員工的監(jiān)管、法規(guī)還需要進一步完善。近期,歐盟《數(shù)字服務法》(DSA)正式生效。法案旨在確保用戶的在線安全,阻止非法或違反平臺服務條款的有害內(nèi)容傳播。作為歐盟委員會數(shù)字化戰(zhàn)略的核心組成部分,法案將為歐洲單一市場的數(shù)字服務活動指定一個統(tǒng)一監(jiān)管標準。相對于歐美國家逐漸完善的數(shù)字服務法案,亞洲國家的相關政策法規(guī)卻又著很大的缺失,如前文所述,在缺乏規(guī)范的背景下,安全性和社會影響會繼續(xù)制約數(shù)字服務、數(shù)字員工的發(fā)展和普及。
最后,數(shù)字員工的需求動力在于降本增效,但目前數(shù)字人的使用成本和維護成本并不低廉。隨著大面積普及,對于數(shù)字人應用成本、效率問題的測算仍有待觀察。
總之,構建技術研發(fā)與技術實踐的良性循環(huán)才能促進數(shù)字員工真正融入行業(yè),第一批參與使用的企業(yè)至關重要,甚至能夠決定產(chǎn)品的未來走向。因此,小冰除了需專注技術研發(fā)和革新,也可以多觀察第一批應用數(shù)字員工企業(yè)的使用情況,結合實際對產(chǎn)品進行持續(xù)改進,以打造出真正具備實用價值的數(shù)字人。
作者:一顆菠菜
來源:松果智能
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!