1. 創(chuàng)業(yè)頭條
  2. 前沿領(lǐng)域
  3. AI智能
  4. 正文

人工智能落地關(guān)鍵:流式推理引擎介紹及對(duì)比

 2020-06-24 14:47  來(lái)源:互聯(lián)網(wǎng)  我來(lái)投稿 撤稿糾錯(cuò)

  一鍵部署OpenClaw

DarwinML Inference:

DarwinML Inference流式推理引擎是為人工智能平臺(tái)量身定做的商業(yè)化產(chǎn)品。

對(duì)于數(shù)據(jù)科學(xué)家而言,它的接口抽象,貼近其思維。不限定底層人工智能框架,給其足夠的自由度。對(duì)于復(fù)雜的模型,支持DAG形式的工作流和數(shù)據(jù)流同圖定義,一目了然且方便后續(xù)運(yùn)營(yíng)商部署和彈性伸縮。

對(duì)于運(yùn)營(yíng)商而言,它采用成熟軟件棧和微服務(wù)架構(gòu),從單機(jī)到超大規(guī)模集群彈性伸縮。它不挑硬件,支持從嵌入式設(shè)備、臺(tái)式機(jī)、大型服務(wù)器、云端虛擬機(jī)和容器乃至商業(yè)集群的各種新老硬件平臺(tái)。它支持對(duì)接模型編譯、小型化等優(yōu)化加速技術(shù),提升模型的適應(yīng)度,提高單位資源的產(chǎn)出。自動(dòng)批量功能能充分發(fā)揮人工智能模型批量計(jì)算和底層硬件向量加速的功能,即成倍提升系統(tǒng)吞吐量,又不增加數(shù)據(jù)科學(xué)家和運(yùn)營(yíng)商的成本。

對(duì)于用戶而言,它提供豐富的接入接口,包括通用RESTful到高性能的RPC,支持從Python和Java的SDK。對(duì)于低延遲的場(chǎng)景,能提供毫秒級(jí)的相應(yīng)。對(duì)于高并發(fā)的場(chǎng)景,支持線性在線自動(dòng)擴(kuò)容。

MetaFlow:

MetaFlow是Netflix開(kāi)源的一款旨在幫助數(shù)據(jù)科學(xué)家開(kāi)發(fā)管理其項(xiàng)目的Python庫(kù)。他側(cè)重于減輕數(shù)據(jù)科學(xué)家在開(kāi)發(fā)、管理數(shù)據(jù)科學(xué)項(xiàng)目時(shí),對(duì)非數(shù)據(jù)科學(xué)類(lèi)其他工程領(lǐng)域的技能要求與投入。使之能關(guān)注于數(shù)據(jù)科學(xué)領(lǐng)域。

對(duì)于數(shù)據(jù)科學(xué)家而言,MetaFlow提供的編程規(guī)范和接口,將人工智能模型及相關(guān)處理的流程以工作流的形式組織起來(lái),其他的事情,都由其后端運(yùn)營(yíng)商負(fù)責(zé)。

對(duì)于運(yùn)營(yíng)商而言,MetaFlow深度集成Amazon AWS,且是當(dāng)前唯一支持的運(yùn)營(yíng)商,對(duì)于需要商用甚至調(diào)試的場(chǎng)景,都需要自己在AWS里面操作,完成存儲(chǔ)、計(jì)算、通訊等適配,才能實(shí)現(xiàn)人工智能模型的服務(wù)化,對(duì)接終端用戶。此外,MetaFlow里面的工作流,不處理數(shù)據(jù)流,完全依賴AWS。

對(duì)于終端用戶而言,MetaFlow只提供了client,用以在python代碼級(jí)別發(fā)起工作流調(diào)用。對(duì)于商用而言,相對(duì)缺少更加便捷豐富的接入方式。

AirFlow:

AirFlow是Airbnb開(kāi)源的一款工作流系統(tǒng),它基礎(chǔ)功能簡(jiǎn)單,通過(guò)插件的形式支持各種語(yǔ)言和執(zhí)行端。

對(duì)于數(shù)據(jù)科學(xué)家而言,它不是一款專(zhuān)門(mén)為期設(shè)計(jì)系統(tǒng),需要引用一系列列插件、甚至是開(kāi)發(fā)一些插件,才能完成與數(shù)據(jù)科學(xué)家及其人工智能模型應(yīng)用的對(duì)接。和MetaFlow一樣,它的工作流也只是涵蓋業(yè)務(wù)層邏輯,不處理數(shù)據(jù)流,它通過(guò)插件支持各主流云平臺(tái),例AWS、Azure、GCP等,也有著和MetaFlow相同的問(wèn)題,對(duì)數(shù)據(jù)科學(xué)家不太友好,比MetaFlow糟糕的是,它的集成相對(duì)MetaFlow來(lái)說(shuō)要晦澀且難用。

對(duì)運(yùn)營(yíng)商而言,AirFlow更像是一個(gè)相對(duì)專(zhuān)業(yè)的底層工作流管理平臺(tái),但對(duì)于人工智能推理服務(wù),他不是專(zhuān)業(yè)的,缺少直接、簡(jiǎn)單、易用的東西,比MetaFlow更為不及。

對(duì)于終端用戶而言,AirFlow提供比較豐富的訪問(wèn)接口,相對(duì)更友好。

MLFlow:

MLFlow是有Databricks開(kāi)源的一款機(jī)器學(xué)習(xí)生命周期管理平臺(tái),推理服務(wù)是其功能之一。

對(duì)于數(shù)據(jù)科學(xué)家而言,MLFlow是一個(gè)比較簡(jiǎn)單易用的機(jī)器學(xué)習(xí)平臺(tái),在推理服務(wù)環(huán)節(jié),支持將同平臺(tái)的模型導(dǎo)出為其標(biāo)準(zhǔn)的格式,例如Python Function、Scikit-learn、pyTorch、Tensorflow等,通過(guò)其部署工具,在支持的運(yùn)行平臺(tái)服務(wù)化。對(duì)比其他的推理引擎,其主要的弱勢(shì)是模型從概念上不是基于工作流的,在構(gòu)建復(fù)雜的中大型模型推理服務(wù)的時(shí)候,需要數(shù)據(jù)科學(xué)家自己解決工作流的問(wèn)題。此外,同MetaFlow和AirFlow一樣,他也不解決數(shù)據(jù)流的問(wèn)題,需要數(shù)據(jù)科學(xué)家結(jié)合運(yùn)營(yíng)商的運(yùn)行平臺(tái)自己解決。

對(duì)于運(yùn)營(yíng)商而言,MLFlow支持4種部署方式,本地單機(jī)部署、Azure、Amazon SageMaker、Apache Spark UDF,但只有本地單機(jī)部署支持多種格式,其他云端、集群部署都只支持Python Function格式。這提高了商業(yè)化運(yùn)行時(shí),對(duì)數(shù)據(jù)科學(xué)家建模時(shí)的格式要求,削弱了MLFlow在建模階段的優(yōu)勢(shì)。

對(duì)于終端用戶而言,MLFlow只提供了RESTFul接口,在要求大流量、高性能、低延時(shí)的場(chǎng)景,還是缺少一些其他的選擇。

申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)標(biāo)簽
人工智能

相關(guān)文章

  • 20%員工或被裁、1.6萬(wàn)人離開(kāi):Meta醞釀史上最大規(guī)模裁員

    文/楊雪健來(lái)源/節(jié)點(diǎn)財(cái)經(jīng)Meta或迎來(lái)史上最大規(guī)模裁員潮。2026年3月14日,路透社曝出Meta正計(jì)劃啟動(dòng)新一輪大規(guī)模裁員,此次裁員比例或達(dá)公司總員工數(shù)的20%,按其近7.9萬(wàn)的員工規(guī)模計(jì)算,約1.58萬(wàn)名員工或?qū)⒈徊?。若該?jì)劃執(zhí)行,將成為Meta自2022年底實(shí)行“效率之年”重組后規(guī)模最大的一次

  • 阿里發(fā)布全球首個(gè)企業(yè)級(jí)Agent平臺(tái)“悟空”

    3月17日,阿里發(fā)布全球首個(gè)企業(yè)級(jí)AI原生工作平臺(tái)——“悟空”,讓每個(gè)團(tuán)隊(duì)、每家公司,都能擁有一支24h工作的”龍蝦軍團(tuán)”。悟空是一款獨(dú)立應(yīng)用,即日起開(kāi)啟邀測(cè),也將直接內(nèi)置到超2000萬(wàn)企業(yè)組織的釘釘之中。擁有8億用戶的釘釘重寫(xiě)底層代碼,進(jìn)行全面CLI(命令行界面)化改造,讓悟空Agent能夠原生操

  • 90%的AI中間商會(huì)消失:Google封號(hào)只是第一槍

    AI的“免費(fèi)紅利期”結(jié)束了,未來(lái)18個(gè)月,靠“API倒賣(mài)”的公司,會(huì)成片消失。這個(gè)導(dǎo)火索就是最近Google的一輪封號(hào)導(dǎo)致的,隨著封號(hào)風(fēng)波的結(jié)束,這也標(biāo)志著AI行業(yè)【收租時(shí)代】來(lái)了。2月封號(hào)潮:高付費(fèi)用戶被一鍋端一周前,Google開(kāi)始大規(guī)模封號(hào),付著250美金月費(fèi)的人,賬號(hào)說(shuō)沒(méi)就沒(méi),Gmail、Y

  • DeepSeek V4意外泄露,原生多模態(tài)

    來(lái)自路透社等媒體報(bào)道的最新消息:DeepSeek未發(fā)布的V4Lite模型遭泄露上網(wǎng),華為獲得早期訪問(wèn)權(quán)限,英偉達(dá)被排除在外。近期,谷歌發(fā)表了2篇Multi-Agent協(xié)作學(xué)習(xí)新論文有網(wǎng)友提供了更加詳細(xì)的信息,DeepSeekV4Lite:100萬(wàn)token上下文窗口(V3為128K)內(nèi)置原生多模態(tài)推

  • 中國(guó)開(kāi)啟AI全民化元年,BAT同入“億級(jí)俱樂(lè)部”

    春節(jié)紅包會(huì)結(jié)束,但AI已融入數(shù)億人生活里

  • 開(kāi)源模型再突破,全球AI行業(yè)的拐點(diǎn)要來(lái)了?

    性能、商業(yè)、生態(tài)詮釋開(kāi)源模型的最佳姿態(tài)

  • 看懂黃仁勛CES演講,就看懂 AI 接下來(lái)十年的走向

    2026年剛開(kāi)年,全世界最狂的那個(gè)男人,穿著他的經(jīng)典黑皮衣,在CES舞臺(tái)上發(fā)出了未來(lái)十年的信號(hào)。他搞了個(gè)“能吃飽套餐”:6個(gè)包子+一碟小菜+一碗粥=肉包子套餐,這樣以后你只要買(mǎi)一個(gè)套餐就能吃飽了。(Rubin平臺(tái))同時(shí)他們店里還免費(fèi)提供的筷子、勺子、蘸料、醬油、醋、水果、零食等等。(開(kāi)放10萬(wàn)億語(yǔ)言

  • GDPS2025賽場(chǎng)直擊!開(kāi)普勒大黃蜂助力華理斬獲搬運(yùn)賽項(xiàng)桂冠

    12月12日-14日,2025全球開(kāi)發(fā)者先鋒大會(huì)暨國(guó)際具身智能技能大賽(GDPS2025)于上海張江科學(xué)會(huì)堂舉行,大會(huì)以具身智能競(jìng)技為核心,融合了技術(shù)比拼、產(chǎn)業(yè)展示與科普體驗(yàn),為全球觀眾呈現(xiàn)出具身智能的現(xiàn)在與未來(lái)。上海開(kāi)普勒機(jī)器人有限公司(以下簡(jiǎn)稱(chēng)"開(kāi)普勒機(jī)器人")攜明星產(chǎn)品K2"大黃蜂"亮相,并參

    標(biāo)簽:
    GDPS
    2025
  • 弈動(dòng) Dynamic·數(shù)智躍遷 博弈無(wú)界|2025TechWorld智慧安全大會(huì)在京召開(kāi)

    在數(shù)字化與智能化深度交織的時(shí)代浪潮中,安全的邊界不斷延展,技術(shù)的演進(jìn)正引領(lǐng)產(chǎn)業(yè)邁向新一輪變革。10月24日,以“弈動(dòng)Dynamic·數(shù)智躍遷博弈無(wú)界”為主題的2025TechWorld智慧安全大會(huì)在北京盛大召開(kāi)。來(lái)自國(guó)家部委、院士學(xué)者、高??蒲袡C(jī)構(gòu)和企業(yè)的權(quán)威專(zhuān)家與業(yè)界精英齊聚北京,共議AI安全、數(shù)

    標(biāo)簽:
    弈動(dòng)
  • 甌江論道:AI賦能綠色發(fā)展

    2025年10月25日,2025世界青年科學(xué)家峰會(huì)之人工智能(AI)融合創(chuàng)新發(fā)展論壇在浙江溫州成功舉辦。本次論壇由國(guó)際院士科創(chuàng)中心主辦,中國(guó)投資協(xié)會(huì)能源投資專(zhuān)業(yè)委員會(huì)、溫港院士科創(chuàng)中心承辦,中國(guó)電工技術(shù)學(xué)會(huì)、中科先進(jìn)技術(shù)溫州研究院與溫州市電力工程學(xué)會(huì)提供支持,以“甌江論道-AI賦能綠色發(fā)展”為主題,

    標(biāo)簽:
    ai技術(shù)

編輯推薦