當(dāng)前位置:首頁 >  科技 >  IT業(yè)界 >  正文

API難以解決AI智能體執(zhí)行能力問題,AI Agent深度落地鎖定RPA

 2024-01-15 15:33  來源: A5專欄   我來投稿 撤稿糾錯(cuò)

  域名預(yù)訂/競(jìng)價(jià),好“米”不錯(cuò)過

論文、項(xiàng)目、產(chǎn)品不斷涌現(xiàn),AI Agent工具使用瞄準(zhǔn)RPA越來越多的AI Agent項(xiàng)目正在融合RPA,背后的邏輯是什么?被遺忘在角落的RPA,成了提升AI Agent執(zhí)行能力的天選神器由RPA廠商推出的RPA Agent,與市面上的Agent有什么不同?源自API的實(shí)驗(yàn)性AI智能體越來越多,基于RPA的實(shí)用性AI Agent穩(wěn)扎穩(wěn)打API難以解決AI智能體執(zhí)行能力問題,AI Agent深度落地鎖定RPA

文/王吉偉

LLM(Large Language Models)剛爆發(fā)之時(shí),很多人認(rèn)為RPA要完了,自然語言交互+API操作足以干掉任何UI自動(dòng)化工具。

然而,大語言模型應(yīng)用發(fā)展到AI Agent這一步,大家才發(fā)現(xiàn)API并不是萬能的。Agent平臺(tái)雨后春筍一般出現(xiàn),但所構(gòu)建的大多Agent只能在問答與訂餐、買機(jī)票之間徘徊。

不能參與復(fù)雜業(yè)務(wù)流程的Agent,也就無法幫助企業(yè)更好地增效降本。

為了讓Agent深度參與到ERP、CRM等企業(yè)管理軟件的自動(dòng)化操作中,除了構(gòu)建與生成更多的API及相關(guān)函數(shù),UI自動(dòng)化也再度成為解決問題的關(guān)鍵,成為Agent架構(gòu)工具使用模塊的首選。

面向龐大而復(fù)雜的企業(yè)管理系統(tǒng),企業(yè)級(jí)Agent的工具模塊解決方案就變成API與UI兼顧,API用以直接調(diào)用插件與工具,UI用于解決非接口軟件的連接。

由此,探索Agent與RPA的廠商越來越多。

OpenAI投資了一家主打“RPA 3.0”的初創(chuàng)企業(yè)Induced AI,面壁智能聯(lián)合清華等機(jī)構(gòu)發(fā)布了“APA”推出了ProAgent,清華&智譜AI團(tuán)隊(duì)發(fā)布了專注于GUI圖形交互界面的理解和導(dǎo)航的CogAgent,騰訊推出了用于移動(dòng)端的AppAgent。

這些相關(guān)項(xiàng)目,本質(zhì)上都是Agent與RPA的結(jié)合。

其實(shí)先一步對(duì)“API+UI”類型Agent解決方案進(jìn)行探索的,是RPA\超自動(dòng)化廠商。從最開始接入LLM到現(xiàn)在推出Agent產(chǎn)品與解決方案,廠商們一直都在積極探索與跟進(jìn)LLM的應(yīng)用。

并且早在大語言模型之前,RPA\超自動(dòng)化廠商就已經(jīng)實(shí)現(xiàn)了兼容API與UI。

Gartner曾在2022年RPA魔力象限報(bào)告中預(yù)測(cè),到2024年,95%的RPA供應(yīng)商將通過API與UI集成提供自動(dòng)化。當(dāng)前融合RPA的超自動(dòng)化廠商,基本實(shí)現(xiàn)了兼顧API與UI。

說到這里,有人可能會(huì)問,如果把功能強(qiáng)大的企業(yè)級(jí)RPA平臺(tái)作為工具融入Agent架構(gòu),這樣的Agent產(chǎn)品是不是就能深度參與到企業(yè)運(yùn)營(yíng)的復(fù)雜業(yè)務(wù)流程?由RPA廠商打造的Agent產(chǎn)品又與其他廠商的產(chǎn)品有什么不同?

本文,王吉偉頻道就跟大家聊聊這些。

AI Agent瞄準(zhǔn)RPA

今年10月份,OpenAI投資了一家RPA初創(chuàng)公司Induced AI。在Induced AI,用戶只需用簡(jiǎn)單的英語輸入工作流程和錄屏視頻,Induced AI就能將其實(shí)時(shí)轉(zhuǎn)換為偽代碼,并調(diào)取多種相關(guān)工具,來執(zhí)行大量重復(fù)性任務(wù)。

從產(chǎn)品描述中可以看到,Induced AI的“RPA 3.0”形態(tài)產(chǎn)品是一款基于大語言模型的智能體。

開始很多人并不知道OpenAI為何要投資一個(gè)RPA公司,但隨著AI Agent越來越熱,在大家意識(shí)到其落地方面存在執(zhí)行能力不足的問題后,瞬間就想明白了OpenAI的“用意”。

把RPA當(dāng)作工具去操作API無法觸達(dá)的企業(yè)管理軟件,自然就能大幅提升Agent的能力,且只有這樣的才有可能打造出企業(yè)級(jí)Agent。

自此開始,關(guān)于Agent與RPA的研究越來越多。

11月份,面壁智能聯(lián)合清華自然語言處理實(shí)驗(yàn) 等機(jī)構(gòu)共同發(fā)布了新一代流程自動(dòng)化范式 Agentic Process Automation(APA,相關(guān)項(xiàng)目為ProAgent),該范式實(shí)現(xiàn)了工作流構(gòu)建的自動(dòng)化,以及工作流執(zhí)行時(shí)動(dòng)態(tài)決策的自動(dòng)化,并通過實(shí)驗(yàn)揭示了大模型智能體在自動(dòng)化中的可行性與潛力。

項(xiàng)目地址:https://github.com/THUDM/CogVLM

而該項(xiàng)研究的主要目的,就是將Agent技術(shù)的靈活性引入RPA(或者說將RPA作為工具引入Agent架構(gòu),也是成立的)。

而在此之前,為了解決LLM面對(duì)用戶指令使用外部工具(API)處理高級(jí)任務(wù)時(shí)的不足問題,面壁智能聯(lián)合來自TsinghuaNLP、耶魯、人大、騰訊、知乎的研究人員推出 ToolLLM 工具學(xué)習(xí)框架中的ToolBench數(shù)據(jù)集,已經(jīng)囊括16464個(gè)真實(shí)世界API。

由此,UI自動(dòng)化對(duì)于Agent在真實(shí)世界應(yīng)用重要性不言而喻。

12月15日,清華&智譜AI團(tuán)隊(duì)發(fā)布了最新研究成果CogAgent-Chat。CogAgent是一個(gè)基于180億參數(shù)規(guī)模的視覺語言模型(VLM)的圖形用戶界面(GUI)智能體,專注于GUI圖形交互界面的理解和導(dǎo)航。

項(xiàng)目地址:https://github.com/THUDM/CogVLM

CogAgent使用屏幕截圖作為輸入,在PC和Android GUI導(dǎo)航任務(wù)上超越了基于語言模型的方法,如Mind2Web和AITW,引領(lǐng)了GUI理解領(lǐng)域的最新技術(shù)發(fā)展。

這個(gè)技術(shù)理念,與實(shí)在智能推出的RPA Agent使用屏幕語義理解技術(shù)通過識(shí)別屏幕構(gòu)建UI自動(dòng)化非常相似,同樣屬于Agent與RPA技術(shù)的結(jié)合。

除了創(chuàng)業(yè)公司,科技大廠也在關(guān)注這個(gè)領(lǐng)域。最近騰訊和德州大學(xué)達(dá)拉斯分校的研究團(tuán)隊(duì)合作開發(fā)了一個(gè)名為AppAgent的項(xiàng)目,該項(xiàng)目可以通過自主學(xué)習(xí)和模仿人類的點(diǎn)擊和滑動(dòng)手勢(shì),在手機(jī)上執(zhí)行各種任務(wù)。

項(xiàng)目地址:https://github.com/mnotgod96/AppAgent

這包括在社交媒體上發(fā)帖、幫助用戶撰寫和發(fā)送郵件、使用地圖、在線購物,甚至進(jìn)行復(fù)雜的圖像編輯。AppAgent已在50個(gè)任務(wù)上進(jìn)行了廣泛測(cè)試,涵蓋了10種不同的應(yīng)用程序。

這個(gè)項(xiàng)目,可以看作Agent與RPA結(jié)合在手機(jī)端的應(yīng)用。

(注:回復(fù) APA,獲取項(xiàng)目相關(guān)論文。)

除了上述項(xiàng)目,王吉偉頻道也接觸過幾個(gè)智能體創(chuàng)業(yè)項(xiàng)目,都采用了Agent+RPA這個(gè)模式。

LLM廠商、科研機(jī)構(gòu)以及科技大廠對(duì)于Agent和RPA的探索與研究,進(jìn)一步驗(yàn)證了當(dāng)前階段RPA對(duì)于AI Agent在各領(lǐng)域落地應(yīng)用的重要性。

背后的邏輯

相較于直接使用LLM,目前的AI Agent產(chǎn)品在體驗(yàn)上的優(yōu)勢(shì)盡顯:

首先,智能程度和普適性高,能較好的理解和推理復(fù)雜的任務(wù)并且做出規(guī)劃;

其次,能高效判斷并使用外部工具,整個(gè)過程的銜接非常流暢。

但隨著更多的使用,大家發(fā)現(xiàn)當(dāng)前Agent的實(shí)驗(yàn)性強(qiáng)于實(shí)用性,存在兩個(gè)影響應(yīng)用的重要問題:

一是效果不穩(wěn)定,多步推理能力不夠。大部分產(chǎn)品demo看上去效果驚艷,但對(duì)于抽象復(fù)雜的問題,能有效解決的比例不到 10%,只適合解決一些中等難度的問題。

二是外部生態(tài)融合度不高。第三方API支持的數(shù)量和生態(tài)不多(基本以搜索和文件讀取功能為主),API覆蓋范圍不夠廣,很難做到比較完整的跨應(yīng)用生態(tài)。

大家知道,目前最流行的也是最理想的AI Agent框架是由OpenAI提出的“LLM+記憶+規(guī)劃+工具使用”四件套。

對(duì)于一款A(yù)I Agent來說,LLM、記憶和規(guī)劃擔(dān)當(dāng)了任務(wù)的分析、拆解與規(guī)劃,工具使用則關(guān)系著執(zhí)行任務(wù)的能力。任務(wù)規(guī)劃得再好,沒有執(zhí)行能力也無法完成任務(wù)。

上面第一個(gè)問題關(guān)聯(lián)的是用戶體驗(yàn)與實(shí)際效果,當(dāng)然還要看Agent面向什么應(yīng)用場(chǎng)景。

如果是2C場(chǎng)景比如購物分析等效果不穩(wěn)定或者等待太長(zhǎng)時(shí)間,大概率會(huì)讓很多用戶放棄使用。

但若是2B場(chǎng)景比如用于程序構(gòu)建,其自動(dòng)化生成應(yīng)用及業(yè)務(wù)流程的能力,遠(yuǎn)比之前手動(dòng)輸入代碼或者拖拽式的無代碼操作的效率要高得多。

而第二個(gè)問題則是企業(yè)應(yīng)用Agent的關(guān)鍵,Agent主要通過API來調(diào)用各種插件工具去執(zhí)行各種任務(wù),工具越強(qiáng)大執(zhí)行能力也越強(qiáng)。

相關(guān)研究數(shù)據(jù)統(tǒng)計(jì),目前公共和私人API的應(yīng)用數(shù)量已接近2億。在國(guó)內(nèi),僅2022年就有6700多萬個(gè)API被創(chuàng)建。

但對(duì)于大型企業(yè)異構(gòu)且復(fù)雜的信息化環(huán)境來說,這些API仍然無法滿足其個(gè)性化、安全性等方面的需求。

加上很多企業(yè)軟件系統(tǒng)缺少API以及開發(fā)成本過高等因素,使得Agent無法操作更多的企業(yè)管理軟件,阻礙了AI Agent的跨部門、跨領(lǐng)域應(yīng)用,執(zhí)行能力大打折扣。

這種情況下,在工具調(diào)用上,如果想打造一款能夠參與復(fù)雜業(yè)務(wù)流程的企業(yè)級(jí)Agent,不只需要通過API調(diào)用工具,更需要通過UI自動(dòng)化實(shí)現(xiàn)各種軟件連接。

RPA和AI Agent有著很強(qiáng)的關(guān)系。接口的設(shè)計(jì)原則是“高內(nèi)聚、低耦合”,實(shí)際上很多軟件很難有接口,這時(shí)候RPA的作用就尤為重要。把API和RPA封裝起來作為“手和腳”,結(jié)合大語言模型“大腦”,Agent才能真正實(shí)現(xiàn)無所不能的智能自動(dòng)化。

由此,一些組織重新把目光重新聚焦到RPA身上。

使用RPA通過基于LLM的AI Agent自動(dòng)執(zhí)行業(yè)務(wù)流程任務(wù)企業(yè)級(jí)應(yīng)用,并構(gòu)建自動(dòng)化流程的長(zhǎng)期維護(hù)機(jī)制,也成為更多組織在智能自動(dòng)化方面新的研究課題。

同時(shí),Agent的執(zhí)行能力落點(diǎn)到RPA,也使得已經(jīng)積累大量數(shù)據(jù)、經(jīng)驗(yàn)、技術(shù)以及生態(tài)能力的RPA廠商所推出的Agent產(chǎn)品,受到更多關(guān)注。

尤其是發(fā)布相關(guān)領(lǐng)域模型的廠商,更是廣大企業(yè)與投資機(jī)構(gòu)關(guān)注的重點(diǎn)。

RPA Agent的優(yōu)勢(shì)

由RPA\超自動(dòng)化廠商推出的基于RPA構(gòu)建的AI Agent,或者將RPA作為工具的Agent,這里將其稱之為RPA Agent。

目前已經(jīng)出現(xiàn)很多Agent構(gòu)建平臺(tái),也出現(xiàn)了大量Agent產(chǎn)品。但如果仔細(xì)觀察這些產(chǎn)品,會(huì)發(fā)現(xiàn)大多數(shù)產(chǎn)品還只是知識(shí)問答類的對(duì)話機(jī)器人,少部分可以通過API操作部分工具或者適用于Agent平臺(tái)的內(nèi)部生態(tài),與OpenAI推出的“準(zhǔn)Agent”產(chǎn)品GPTs相似。

這些封裝了大語言模型產(chǎn)品能力的類智能體產(chǎn)品,或者說是智能體的早期產(chǎn)品,跟歐美技術(shù)圈所定義的智能體還有一些差距,在能力上缺少了調(diào)用API的靈活性,也缺少了用RPA去連接更多管理軟件的通用性。

類似的智能體能夠勝任內(nèi)容生成、推理分析及反饋等,對(duì)于一些不需要太多企業(yè)管理系統(tǒng)的中小微企業(yè)大部分業(yè)務(wù)運(yùn)營(yíng)都能勝任。

但在執(zhí)行層面就要差很多,不能在生成內(nèi)容后執(zhí)行其他業(yè)務(wù)流程的任務(wù)自動(dòng)化,缺少了對(duì)長(zhǎng)流程的支持,無法調(diào)用工具去完成復(fù)雜業(yè)務(wù)流程的自動(dòng)化執(zhí)行。

與這類Agent相比,RPA Agent恰好可以解決上述Agent難以解決的問題。

RPA本身就是為解決UI自動(dòng)化而生,用于彌補(bǔ)API自動(dòng)化覆蓋范圍小、開發(fā)難度大等的不足。

為了保證RPA運(yùn)行的穩(wěn)定性,廠商們?cè)诩夹g(shù)及產(chǎn)品上面下了很大的功夫,比如屏幕語義識(shí)別、IPA模式等,這樣的產(chǎn)品作為Agent的調(diào)用工具,具備操作大型企業(yè)復(fù)雜業(yè)務(wù)流程的天然屬性。

在上一輪業(yè)務(wù)數(shù)字化改造中,大量企業(yè)在業(yè)務(wù)流程自動(dòng)化上都引入了性價(jià)比很高的RPA\超自動(dòng)化解決方案。LLM爆發(fā)后,超自動(dòng)化廠商都在積極融合LLM,并且現(xiàn)在開始陸續(xù)推出Agent解決方案。

其實(shí)對(duì)于已經(jīng)引入RPA\超自動(dòng)化解決方案的企業(yè)來說,想要享受Agent紅利很簡(jiǎn)單。如果RPA服務(wù)商已經(jīng)推出Agent解決方案,只需要將原有解決方案中使用的產(chǎn)品或者技術(shù)升級(jí)成為Agent解決方案即可,一般而言廠商可以提供技術(shù)平移及迭代的服務(wù)。

這樣企業(yè)就不用再去了解和引入新的Agent解決方案,避免更多的投資與開銷,這在當(dāng)前經(jīng)濟(jì)下行的形勢(shì)下是蠻重要的。

Agent廠商在為廣大企業(yè)提供個(gè)性化服務(wù)及部署時(shí),也會(huì)基于原有企業(yè)的RPA系統(tǒng)去做相應(yīng)的解決方案,這使得大量企業(yè)的Agent解決方案實(shí)則都是在工具應(yīng)用上調(diào)用RPA去執(zhí)行各種企業(yè)管理軟件的操作。

顯然在這個(gè)部署的過程中,先一步推出基于RPA的Agent解決方案的廠商將會(huì)更具優(yōu)勢(shì),因?yàn)樗麄儗?duì)RPA以及超自動(dòng)化有著更深的理解,也能讓其Agent解決方案能夠觸達(dá)企業(yè)運(yùn)營(yíng)的更深層。

從目前市面上大多AI Agent以及用戶反饋來看,AI智能體想要真正在B端實(shí)現(xiàn)量級(jí)業(yè)務(wù)場(chǎng)景的落地及更好地商用,需要綜合考量其本身的安全性、技術(shù)發(fā)展周期是否成熟以及To B端的場(chǎng)景是否密切貼合,更需要考慮接口成本、隱私、管理、授權(quán)等諸多因素。

從具體需求來看,比如金融領(lǐng)域大B客戶對(duì)于查詢和拆解指標(biāo)、項(xiàng)目數(shù)據(jù)查看分析、推送報(bào)表/報(bào)告等需求,看起來簡(jiǎn)單卻不是簡(jiǎn)單的GPTs或者知識(shí)內(nèi)容類Agent能夠?qū)崿F(xiàn)的。

其中的業(yè)務(wù)流程涉及到了深入企業(yè)管理系統(tǒng)的復(fù)雜流程自動(dòng)化構(gòu)建,更涉及到了數(shù)據(jù)庫讀取、API管理及UI自動(dòng)化連接等。

目前僅是基于API接口讀取數(shù)據(jù)及調(diào)用工具插件的Agent,難以實(shí)現(xiàn)這樣的流程應(yīng)用,而基于LLM并同時(shí)兼顧API與UI自動(dòng)化的RPA Agent是不錯(cuò)的解決方案。

在廣大企業(yè)關(guān)注的數(shù)據(jù)安全方面,相較于API模式,RPA模式的優(yōu)勢(shì)在于對(duì)系統(tǒng)的無侵入。通過結(jié)合ISSUT(智能屏幕語義理解)等技術(shù),RPA能夠?qū)θ祟惒僮飨到y(tǒng)的行為進(jìn)行模仿,并通過識(shí)別屏幕上的軟件進(jìn)行操作,全流程不會(huì)對(duì)系統(tǒng)和數(shù)據(jù)造成任何損害。

此外對(duì)于系統(tǒng)設(shè)計(jì)而言,對(duì)外暴露的API越多,安全風(fēng)險(xiǎn)越高。在實(shí)在智能CEO孫林君看來,系統(tǒng)的設(shè)計(jì)原則是“高內(nèi)聚,低耦合”,即用大模型去構(gòu)建Agent時(shí),軟件暴露的API越少越好。

所以,RPA Agent不只是一種行之有效的Agent解決方案,更是當(dāng)下LLM時(shí)代企業(yè)應(yīng)用Agent的新范式。

RPA Agent實(shí)例解讀

下面,我們來看兩個(gè)已經(jīng)發(fā)布的RPA Agent產(chǎn)品案例。

案例1:實(shí)在智能TARS-RPA-Agent

上個(gè)月完成近2億元C輪融資的實(shí)在智能在8月份所推出的實(shí)在Agent智能體,是一個(gè)典型的企業(yè)級(jí)Agent智能體產(chǎn)品。

實(shí)在Agent智能體,既可以支持私有化部署,又支持無需部署就可以方便用戶使用的大語言模型的超自動(dòng)化智能體,它基于“自研垂直大語言模型TARS和ISSUT(智能屏幕語義理解)雙模引擎打造。

該產(chǎn)品實(shí)現(xiàn)了全行業(yè)首個(gè)“你說PC做,所說即所得”,能夠自主拆解任務(wù)、感知當(dāng)前環(huán)境、執(zhí)行并且反饋、記憶歷史經(jīng)驗(yàn)。

實(shí)在智能自研的基座大語言模型TARS,最大特點(diǎn)是被投喂了大量的行業(yè)知識(shí),KNOW-HOW和自動(dòng)化流程數(shù)據(jù),有利于TARS對(duì)客戶業(yè)務(wù)流程的理解和拆解,使得實(shí)在Agent智能體能夠更好的規(guī)劃與執(zhí)行復(fù)雜的業(yè)務(wù)流程。

實(shí)在Agent智能體能夠聽懂業(yè)務(wù)用戶的所有指令,更能準(zhǔn)確把指令任務(wù)自主拆解成方便后續(xù)自動(dòng)化流程去執(zhí)行的“生成式,懂業(yè)務(wù)的智能數(shù)字員工”。

只需簡(jiǎn)單說一句話,實(shí)在Agent智能體就能幫用戶操作電腦軟件完成各種工作和任務(wù),每個(gè)流程中的步驟百分百可視,用戶可以邊查看執(zhí)行的每一個(gè)步驟,邊判斷整個(gè)自動(dòng)化流程是否準(zhǔn)確,并可以隨時(shí)進(jìn)行調(diào)整。

使用智能體可以替代手工作業(yè),實(shí)現(xiàn)至少300%效率提升,保證數(shù)據(jù)處理準(zhǔn)確無誤,防止人為因素風(fēng)險(xiǎn),將個(gè)人智慧轉(zhuǎn)化為企業(yè)組織智慧,沉淀人機(jī)協(xié)同經(jīng)驗(yàn)。

作為一款企業(yè)級(jí)AI Agent平臺(tái),實(shí)在Agent智能體具備識(shí)別與理解、系統(tǒng)方案、深入匹配、專有部署、更加可信、自主可控、持續(xù)迭代等多種特性,可以為企業(yè)打造無需額外配置、開箱即用且效果立竿見影的智能體助理,幫助員工提升工作效率和創(chuàng)造力,賦能企業(yè)增效降本。

案例2:壹沓科技CubeAgent

CubeAgent是壹沓科技推出的基于大模型的數(shù)字員工平臺(tái),為企業(yè)提供基于大模型技術(shù)驅(qū)動(dòng)的數(shù)字員工聚合及訓(xùn)練平臺(tái),幫助企業(yè)輕松構(gòu)建專有的“數(shù)字員工團(tuán)隊(duì)”,為白領(lǐng)員工配備具備多種能力的“辦公小助手”,一站式幫助企業(yè)員工完成所有的日常工作。

在供應(yīng)鏈領(lǐng)域,運(yùn)小沓數(shù)字員工平臺(tái)是全球首款供應(yīng)鏈大模型產(chǎn)品,能夠?yàn)楣?yīng)鏈企業(yè)量身打造虛擬數(shù)字員工專家團(tuán)隊(duì),資深供應(yīng)鏈運(yùn)價(jià)經(jīng)理、物流可視追蹤經(jīng)理、供應(yīng)鏈新人成長(zhǎng)師、行業(yè)案例專家行業(yè)翻譯大師、行政問答助理等,提供高效所答即所問的供應(yīng)鏈領(lǐng)域準(zhǔn)確知識(shí)。實(shí)現(xiàn)這一切,只需像跟同事聊天一樣。

作為供應(yīng)鏈企業(yè)更加智能的業(yè)務(wù)自動(dòng)化解決方案,運(yùn)小沓數(shù)字員工平臺(tái)可以助力企業(yè)實(shí)現(xiàn)產(chǎn)品智能調(diào)用和辦公系統(tǒng)智連:一句話查運(yùn)價(jià)、發(fā)艙單、物流追蹤,智能運(yùn)行FMS、OA、CRM,提升組織敏捷性,開啟全新智能辦公時(shí)代。

借助一系列虛擬辦公助手,運(yùn)小沓數(shù)字員工平臺(tái)也將為供應(yīng)鏈企業(yè)提供更加智能的業(yè)務(wù)自動(dòng)化解決方案、「白領(lǐng)員工+CubeAgent數(shù)字員工」的人機(jī)協(xié)作智能辦公新模式,提升組織人才密度、敏捷性,幫助供應(yīng)鏈企業(yè)重構(gòu)生產(chǎn)關(guān)系,推動(dòng)企業(yè)生產(chǎn)力躍遷。

據(jù)悉在商業(yè)拓展方面,運(yùn)小沓數(shù)字員工平臺(tái)已經(jīng)跟供應(yīng)鏈Top企業(yè)在大模型方面達(dá)成戰(zhàn)略合作,并宣布成立了Next Club。

Induced AI已經(jīng)在前面介紹過,這里不再作為案例贅述。

后記:RPA Agent的“iPhone時(shí)刻”

把時(shí)間軸放大去看,在API一統(tǒng)數(shù)字化江湖之前,RPA會(huì)一直擁有存在的價(jià)值。只要仍舊存在UI操作的業(yè)務(wù)流程,只要API無法解決所有軟件的聯(lián)通問題,RPA或者類RPA工具就會(huì)一直充當(dāng)UI自動(dòng)化的連接器。

歐美日韓等地域的RPA\超自動(dòng)化應(yīng)用普及率已經(jīng)很高,意味著API+UI的Agent解決方案更容易得到推廣。

而國(guó)內(nèi)市場(chǎng)尤其是制造業(yè)等信息化相對(duì)滯后的領(lǐng)域,目前剛進(jìn)入RPA2.0\3.0的時(shí)代。對(duì)于引入AI+RPA解決方案的企業(yè),傳統(tǒng)AI技術(shù)早晚會(huì)變成LLM技術(shù),而Agent解決方案也將是最佳的LLM應(yīng)用方案。屆時(shí),大部分廠商都將是RPA Agent解決方案。

由此來看,至少未來5-10年,RPA Agent或者以類RPA產(chǎn)品為工具的AI Agent會(huì)成為企業(yè)數(shù)字化運(yùn)營(yíng)的主流模式。

所以,“RPA Agent”這個(gè)詞組,除了表達(dá)它是一種“以RPA為工具的Agent”之外,更意味著Agent+RPA管理企業(yè)數(shù)字化運(yùn)營(yíng)的模式即將流行起來。

表面上看,RPA成了AI Agent執(zhí)行層面的超級(jí)工具。反過來看,AI Agent也在借助RPA落地。

在埃森哲最新發(fā)布的《2024年技術(shù)展望》趨勢(shì)報(bào)告中,將“智能體-AI互聯(lián)網(wǎng)的生態(tài)系統(tǒng)“列入第二趨勢(shì),再次證明AI Agent將在組織運(yùn)營(yíng)中扮演的重要角色。

同時(shí)該報(bào)告調(diào)查數(shù)據(jù)顯示,96%的高管認(rèn)為,在未來3年內(nèi)充分利用AI Agent生態(tài)系統(tǒng)將成為其組織的重要機(jī)遇。AI Agent生態(tài)系統(tǒng)的崛起正在改變企業(yè)智能和自動(dòng)化戰(zhàn)略的思考方式,將帶來巨大的機(jī)遇和挑戰(zhàn)。

這意味著,AI Agent會(huì)帶來組織的深度變革與企業(yè)數(shù)字化運(yùn)營(yíng)范式的轉(zhuǎn)變,也將帶來廣闊的市場(chǎng)空間。

對(duì)于智能體早期企業(yè)可以做什么,埃森哲也提到越早為智能體準(zhǔn)備好相關(guān)的基礎(chǔ)設(shè)施和信息,智能體就能越早發(fā)揮潛力。并建議重新考慮某些數(shù)據(jù)管理實(shí)踐,比如數(shù)據(jù)庫的向量化處理、提供用于訪問數(shù)據(jù)的新API以及擴(kuò)展與公司系統(tǒng)進(jìn)行接口 交互的工具等。

而當(dāng)前與系統(tǒng)進(jìn)行接口 交互的主流自動(dòng)化工具,正是能夠通過UI連接不同系統(tǒng)以補(bǔ)充API生態(tài)不足的RPA。

由此,作為能夠深扎復(fù)雜業(yè)務(wù)流程且執(zhí)行能力更強(qiáng)的AI智能體,RPA Agent的“iPhone時(shí)刻”已然到來。

【王吉偉頻道,關(guān)注AIGC與IoT,專注數(shù)字化轉(zhuǎn)型、業(yè)務(wù)流程自動(dòng)化與RPA,歡迎關(guān)注與交流?!?/p>

申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)文章

熱門排行

信息推薦