怎樣低成本、高效率完成大批量人工智能(AI)算法模型的生產(chǎn)?在面向真實場景的AI模型應(yīng)用中,這個樸素的問題正愈發(fā)成為“剛需”。畢竟術(shù)業(yè)有專攻,連廣大專業(yè)的AI算法工程師都為了“煉丹”通宵達(dá)旦,半路入門的非專業(yè)人士要想做出一個好用的AI模型,耗時費力在所難免,還冒著跑不出滿意性能的風(fēng)險。那么能不能打造一個工具,將AI模型開發(fā)全流程變得像上手App般輕松易學(xué)?多位國際AI學(xué)術(shù)大牛正在組隊推進(jìn)這樣的研究。他們共同發(fā)起了一個免費開放、無代碼的產(chǎn)品級開源AI基礎(chǔ)軟件平臺YMIR,想要借助開源的力量,讓每一家企業(yè)都能輕松高效地開發(fā)出滿足實際業(yè)務(wù)需求的高質(zhì)量AI模型。YMIR今年5月才正式上線,短短半年已在社區(qū)大受歡迎,截至目前吸引了超過500家企業(yè)使用,涉及機(jī)器人、工業(yè)、芯片等行業(yè)。據(jù)開發(fā)者反饋,使用YMIR后算法生產(chǎn)效率普遍提升6倍,算法人員的需求量降為原來的1/10?,F(xiàn)在,它進(jìn)一步瞄準(zhǔn)AI開發(fā)過程的常見痛點,升級至2.0版本,增設(shè)了公共算法庫、一鍵模型部署等新功能,真正實現(xiàn)AI模型生產(chǎn)的全生命周期覆蓋。開發(fā)者不僅可以在該平臺上免費獲取多類常見算法,而且只是動動鼠標(biāo),就能將算法一鍵部署到終端設(shè)備中,實現(xiàn)“開發(fā)即應(yīng)用”。不管你是想要輕松上手AI開發(fā),還是想要優(yōu)化AI開發(fā)效率、提高AI模型質(zhì)量,這都是個值得一試的生產(chǎn)力工具。
▲YMIR主頁
01 免費開放算法,高精度模型隨用隨取
要實現(xiàn)AI模型的規(guī)?;a(chǎn),需要有更好用的工具,來精簡整個開發(fā)流程中的重復(fù)步驟,為開發(fā)者持續(xù)“減負(fù)”。許多云大廠及AI公司都在為此拼技術(shù)、拼經(jīng)驗,將開發(fā)門檻一降再降。問題是,AI應(yīng)用場景太廣泛了,從廚房監(jiān)控蟲鼠到工廠質(zhì)檢零件,很難能用一套兼而有效的解決方案去滿足各類應(yīng)用需求。而企業(yè)推出的AI開發(fā)平臺,大多聚焦于部分業(yè)務(wù)相關(guān)的高頻場景,難免不能顧及一些偏低頻、小眾的應(yīng)用需求。面對這些難題,開源也許是更有效的解法。在計算機(jī)發(fā)展史中,開源的價值不言而喻,眾多開發(fā)者的智慧與經(jīng)驗?zāi)Y(jié)在一起,共同打磨出更高質(zhì)量、更完善的作品。同樣,開源AI基礎(chǔ)軟件平臺YMIR也是一項“眾志成城”的工作——一群產(chǎn)品經(jīng)驗豐富的AI算法開發(fā)人員參與其中,將此前的經(jīng)驗以數(shù)據(jù)、流程等可視化的形式沉淀積累,通過流水線流程設(shè)計,大幅提升AI算法模型的生產(chǎn)效率。YMIR平臺通過無代碼開發(fā)方式,實現(xiàn)數(shù)據(jù)管理、數(shù)據(jù)挖掘、模型訓(xùn)練、模型驗證等功能,以數(shù)據(jù)驅(qū)動算法模型訓(xùn)練和迭代,使得開發(fā)者能夠一站式開發(fā)可應(yīng)用部署在工業(yè)化生產(chǎn)中的算法,滿足實際業(yè)務(wù)的需求。這樣一來,高質(zhì)量的AI模型開發(fā),就不再是只有“專家”才能辦到的事。一些中小型企業(yè)也得以節(jié)約更多專業(yè)人才的招聘留用成本,同時具備快速訓(xùn)練出滿足業(yè)務(wù)需求的AI模型的能力。還有一個“減負(fù)”新招,是“公共算法庫”板塊。這是YMIR2.0的新增功能,開放了第三方算法。開發(fā)者如果不想從頭訓(xùn)練,就可以在“公共算法庫”直接選用已經(jīng)被訓(xùn)練就緒的算法模型,調(diào)用部署到自己的業(yè)務(wù)中。
▲公共算法庫
目前,“公共算法庫”中的算法均可免 費 使 用,已預(yù)置有城市治理、防疫、明廚亮灶等行業(yè)的多種算法,包括“人車非”檢測、口罩檢測、廚師服穿著檢測等常用的高精度算法,而且在持續(xù)上新。你也可以將自己訓(xùn)練好的算法模型公開上傳,方便有同類需求的開發(fā)者調(diào)用,這樣有助于減少重復(fù)開發(fā)造成的資源浪費問題。對于上傳的算法,YMIR團(tuán)隊有一套專門的審核流程,來確保算法精度能通過標(biāo)準(zhǔn)化測試,滿足基礎(chǔ)的應(yīng)用要求。
02 一鍵部署,打通AI開發(fā)“最后一公里”
除了幫開發(fā)者提高訓(xùn)練效率外,YMIR2.0還上線了另一個AI研發(fā)重要環(huán)節(jié)——“一鍵部署”,以解決從算法到應(yīng)用的“最后一公里”問題。AI算法模型開發(fā)的最終目標(biāo),是將其部署到實際業(yè)務(wù)場景中,發(fā)揮應(yīng)用價值。將部署環(huán)節(jié)標(biāo)準(zhǔn)化,不僅省力,也更省錢。以前工業(yè)界中,一個開發(fā)團(tuán)隊做硬件部署,普遍至少需要由幾位工程師組成的小團(tuán)隊,每年僅是人才成本就動輒有上百萬元。而YMIR2.0上線的模型部署功能,只要一鍵點擊鼠標(biāo),就能將高精度算法模型以簡單、高效的方式部署到智能攝像機(jī)等各類終端設(shè)備中。
▲算法一鍵部署到硬件設(shè)備上
這個部署功能的實現(xiàn),對開發(fā)團(tuán)隊的能力提出了更高要求,既需實現(xiàn)高度模塊化,使其能兼容所有算法,又得在部署速度上具備優(yōu)勢,從而支撐起更高精度、更大規(guī)模的模型部署。這樣一來,企業(yè)不僅可以省去上百萬元的成本,而且有效縮短算法進(jìn)入市場的周期。完成算法部署后,開發(fā)者還能夠通過平臺觀察獲取算法在應(yīng)用中的表現(xiàn)。
模型可部署到的硬件設(shè)備也是開放的。目前YMIR2.0支持包括瑞芯微在內(nèi)的6款硬件平臺。順帶提一句,YMIR已開啟硬件設(shè)備(部署硬件)認(rèn)證,并有多個廠家已通過,在“Github-硬件支持”模塊或者京東上搜索“YMIR”就能查到相關(guān)信息。
之前YMIR1.0剛上線時,智東西曾上手體驗過,只要具備開發(fā)AI算法的基礎(chǔ)知識,基本上不需要付出什么學(xué)習(xí)成本,跟著可視化頁面的指引,就能很輕松地跑通AI模型訓(xùn)練及管理流程?,F(xiàn)在升級的YMIR2.0,可以較明顯地感受到用戶體驗方面有進(jìn)一步做優(yōu)化,人機(jī)交互設(shè)計變得更加友好,模型生產(chǎn)迭代過程更直觀,引導(dǎo)用戶操作的體驗也比之前更加流暢。
▲全流程項目迭代
對于AI開發(fā)來說,算法是靈魂,數(shù)據(jù)是生產(chǎn)力。訓(xùn)練測試模型的數(shù)據(jù)集如果有問題,算法再優(yōu)質(zhì)也會白搭進(jìn)去不少力氣。因此YMIR2.0還新增了對開發(fā)者非常有用的數(shù)據(jù)分析、模型診斷等功能,這對有密集AI開發(fā)需求的企業(yè)或個人提高效率會很有幫助。數(shù)據(jù)分析可以對數(shù)據(jù)集的大小、質(zhì)量、標(biāo)注框總數(shù)、標(biāo)注框分辨率等進(jìn)行管理和分析,還能分析模型生產(chǎn)后在測試集上的表現(xiàn)。
▲數(shù)據(jù)集分析
模型診斷則通過自動化分析模型和可視化呈現(xiàn),有助于提高查錯效率,更加立體地呈現(xiàn)模型在什么地方出了問題、在什么地方表現(xiàn)比較好,從而使開發(fā)者可以更有針對性地調(diào)整優(yōu)化算法設(shè)計。
▲模型診斷
03 萬里長城第一步,終極目標(biāo)是AI生態(tài)繁榮
YMIR平臺由一支國際化團(tuán)隊發(fā)起,包含多位國內(nèi)外知名AI產(chǎn)學(xué)界大牛。比如云天勵飛首席科學(xué)家王孝宇;美國硅谷NEC實驗室媒體分析部主管,印裔科學(xué)家Manmohan Chandraker;前谷歌、亞馬遜、Snap機(jī)器學(xué)習(xí)研究員,硅谷公司Heali聯(lián)合創(chuàng)始人、首席AI官,法裔科學(xué)家William Brendel等等,都在YMIR發(fā)起團(tuán)隊陣營中。
▲云天勵飛首席科學(xué)家王孝宇(圖左),印裔科學(xué)家Manmohan Chandraker(圖中),法裔科學(xué)家William Brendel(圖右)
其相關(guān)論文去年被國際頂級機(jī)器學(xué)習(xí)會議NIPS 2021收錄。
▲YMIR論文
云天勵飛首席科學(xué)家王孝宇告訴智東西,起初YMIR開發(fā)團(tuán)隊預(yù)期會有更多的個人開發(fā)者上手試用該平臺,但出乎意料的是,短短5個月間,YMIR平臺已經(jīng)在產(chǎn)業(yè)界砸出一些水花,被不少來自不同行業(yè)的企業(yè)嘗試。“用戶是用腳投票的。”王孝宇說,能提升開發(fā)效率、解決實際問題,開發(fā)者就愿意采用。與市面上一些基于云服務(wù)的AI開發(fā)平臺不同,作為一個開源平臺,YMIR具有低成本、開放式設(shè)計等優(yōu)勢,不僅全流程功能免費、允許開發(fā)者按需修改優(yōu)化代碼,而且能滿足私有化部署對于隱私安全的需求,全開發(fā)流程可在本地進(jìn)行,數(shù)據(jù)和算法模型完全掌握在開發(fā)者或企業(yè)自己手中。王孝宇希望企業(yè)或個人用戶在使用YMIR2.0平臺的過程中,也能夠積極回饋社區(qū),共同努力將這個項目做得更好。在他看來,現(xiàn)階段AI商業(yè)化解決方案雖然很多,但每家各做各的,沒有形成合力,其實并不利于AI長遠(yuǎn)的發(fā)展。人們對于如何使用標(biāo)準(zhǔn)化AI軟件去推動產(chǎn)業(yè)升級缺乏經(jīng)驗,這是一個預(yù)期非常長的有待被教育的過程。“只有整個行業(yè)形成共識,認(rèn)同AI是必須使用到的技術(shù)能力時,AI產(chǎn)業(yè)才能往更高的層次推進(jìn),標(biāo)準(zhǔn)化AI生產(chǎn)工具會變成未來不可分割的一部分。”王孝宇說。目前,YMIR在做的事,即是通過實現(xiàn)小閉環(huán),讓更多AI企業(yè)能夠利用這些小閉環(huán)幫助客戶打造大閉環(huán),逐漸形成標(biāo)準(zhǔn)的通用化工具,最終推動整個AI大生態(tài)的繁榮。
04 結(jié)語:征文活動評選中最高贏5500元獎勵和工作機(jī)會
開源AI項目并不少見,但一款全流程免費開放、能適應(yīng)大多數(shù)垂直類行業(yè)差異化應(yīng)用需求的開源AI開發(fā)平臺,目前仍相對稀缺,YMIR平臺也還在持續(xù)進(jìn)化和擴(kuò)容生態(tài)的路上。為了進(jìn)一步鼓勵和吸引開發(fā)者,YMIR開發(fā)團(tuán)隊計劃舉辦“YMIR主題種草征文”活動,邀請各位開發(fā)者來講述YMIR的使用心得?;顒訉⒆罱K被評出一等獎、二等獎、三等獎若干,分別可獲得卡券5000元、卡券1000元、卡券500元,以及附加獎若干,可獲得卡券500元。優(yōu)秀作品作者將有機(jī)會獲得YMIR團(tuán)隊的工作/實習(xí)機(jī)會。
(本文轉(zhuǎn)自【智東西】)
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!