近幾年CV(計算機視覺)一直是AI最火的技術(shù)領(lǐng)域之一。經(jīng)過幾年的攻城略地,國內(nèi)市場已經(jīng)形成了曠視、依圖、商湯、云從這「CV四小龍」盤踞的格局。
但目前CV應(yīng)用仍然局限在人臉識別領(lǐng)域,應(yīng)用范圍有限并且容易看見天花板。隨著人臉識別算法的普及,企業(yè)很難做出有競爭力的差異化產(chǎn)品。
國內(nèi)的云通訊巨頭容聯(lián)云通訊(簡稱容聯(lián))從2018年起開始涉足CV產(chǎn)業(yè)應(yīng)用,將AI視覺技術(shù)帶入產(chǎn)業(yè),通過分析監(jiān)控視頻為企業(yè)、項目的生產(chǎn)和運營提供指導(dǎo)。
容聯(lián)的實踐無疑為已成紅海的CV行業(yè)指出了一條新的路子。
撰文 | 徐丹
坐落于合肥的海爾滾筒洗衣機工廠中,工作人員正緊張有序的進行洗衣機生產(chǎn)。生產(chǎn)線的另一邊,一臺機器通過攝像頭密切記錄著生產(chǎn)情況。
當一臺生產(chǎn)好的洗衣機進入傳送帶時,機器迅速發(fā)出警報,因洗衣機表面出現(xiàn)略微凹陷。
這臺機器便是容聯(lián)的智能視覺分析平臺「慧眼」,2019年落地海爾智慧工廠,通過監(jiān)控分析來識別違規(guī)生產(chǎn)動作、產(chǎn)品瑕疵和安全隱患,自動識別違規(guī)操作并記錄,大大降低次品率和賠付成本。
海爾工廠的需求并不是特例,在常見的人臉識別等監(jiān)控類安防外,越來越多的企業(yè)需要一種操作系統(tǒng),可以「讀懂」監(jiān)控內(nèi)容為生產(chǎn)提供指導(dǎo)。
這種操作系統(tǒng)可以稱之為垂直于行業(yè)的CV產(chǎn)品,目前這個賽道還未完全成型,專注于此的大多數(shù)是在某一個行業(yè)深耕的創(chuàng)業(yè)公司,難見行業(yè)巨頭。
容聯(lián)是國內(nèi)云通訊市場「老大哥」,2018年開始推出行業(yè)CV產(chǎn)品,目前已經(jīng)涉足智能制造、化工園區(qū)、智慧工地等多個行業(yè),合作的頭部企業(yè)十幾家。
一、在CV行業(yè)沖出新路子
細數(shù)AI技術(shù)落地應(yīng)用,CV應(yīng)該可以說是國內(nèi)最成熟的一個市場。但正因成熟,目前市場競爭格局基本成型,巨頭環(huán)伺。
「CV四小龍」牢筑護城河,創(chuàng)業(yè)公司很難進入,并且人臉識別算法的普及和應(yīng)用遍地開花,產(chǎn)品已經(jīng)很難做出差異。
生產(chǎn)端雖然火熱,但從實際落地情況看,除一些車站、小區(qū)、辦公園區(qū)等公共場所應(yīng)用到人臉識別產(chǎn)品外,行業(yè)感知度并不高。
「AI技術(shù)雖然發(fā)展迅速,但大多數(shù)行業(yè)對AI應(yīng)用都還很陌生?!谷萋?lián)聯(lián)合創(chuàng)始人許志強說。
并且對行業(yè)來說,人臉識別解決的問題畢竟有限。而海爾工廠的案例也代表著許多行業(yè)真正需求點。在監(jiān)控產(chǎn)品外,他們還需要一個視覺分析系統(tǒng),通過分析監(jiān)控內(nèi)容對生產(chǎn)運營提供實際指導(dǎo)。
據(jù)許志強具體解釋,這種系統(tǒng)可以看作是對監(jiān)控的補充。系統(tǒng)對接監(jiān)控攝像頭,通過標準協(xié)議采集攝像頭視頻流,對視頻進行抽幀處理,然后根據(jù)配置的算法模型識別異常情況。包括人員入侵、煙火等安全問題或者生產(chǎn)流程中不規(guī)范操作、產(chǎn)品瑕疵等等。
目前致力于行業(yè)CV的大多數(shù)是垂直某個行業(yè)的小型創(chuàng)業(yè)公司,難見行業(yè)巨頭,但需求極大,用許志強的話說,「這是一個百億級別的規(guī)模的,剛剛起步的市場?!?/p>
容聯(lián)成立于2013年,是云通訊市場最大的獨角獸。以云化和智能化的方式,為企業(yè)客戶提供全面的通訊服務(wù)。包括PaaS通訊能力(語音、短信等)、CC(云客服與云聯(lián)絡(luò)中心)、UC(IM即時通訊云、空中營業(yè)廳、企業(yè)直播)和“通訊+AI”服務(wù),助力企業(yè)提高溝通體驗和經(jīng)營效率。
2016年容聯(lián)開始根據(jù)市場需求涉足AI,2018年與華中科技大學聯(lián)合成立AI實驗室,主要研發(fā)深度學習AI算法,在此基礎(chǔ)上推出了基于智能語音識別、自然語言理解的AICC、智能客服產(chǎn)品。
同時,根據(jù)自身的視頻處理技術(shù)和AI算法的積累,容聯(lián)也向CV行業(yè)伸出了觸角,推出了智能視覺分析平臺「慧眼」和智能化視頻識別分析一體機「Aibox」兩款產(chǎn)品。
慧眼屬于平臺產(chǎn)品,適用于100路以上的攝像頭分析。不僅提供標準化的算法模型,還提供能力接口和模型優(yōu)化服務(wù),比如落地海爾工廠的慧眼就可根據(jù)生產(chǎn)情況定制工序檢查和生產(chǎn)線監(jiān)控模型。
根據(jù)定制產(chǎn)品積累的算法模型,容聯(lián)后續(xù)又根據(jù)低預(yù)算客戶需求推出標準化硬件產(chǎn)品Aibox,內(nèi)置多種算法模型,適用于100路以下攝像頭分析,不提供定制和優(yōu)化模型服務(wù)。
二、受海爾、國家電網(wǎng)等多家巨頭企業(yè)青睞,能「讀懂」監(jiān)控的算法什么樣?
目前容聯(lián)CV團隊近100人,產(chǎn)品已經(jīng)在化工園區(qū)、智慧工地、智慧工廠、明廚亮灶等多個行業(yè)落地,合作的客戶十幾家,包括海爾、國家電網(wǎng)、中國石化、中國石油等。
相比于傳統(tǒng)監(jiān)控產(chǎn)品,慧眼和Aibox最大的優(yōu)勢就是可以深入行業(yè)環(huán)境幫助企業(yè)降本增效。
以智慧工地為例,慧眼可結(jié)合工地復(fù)雜現(xiàn)場做全方面檢測。
比如出入口人員檢測環(huán)節(jié),除常規(guī)人臉識別外,還可做人數(shù)統(tǒng)計、安全帽、反光衣和聚集檢測,車輛檢測包括類型識別、數(shù)量識別,甚至輪胎泥土檢測。
現(xiàn)場作業(yè)區(qū)域可識別入侵檢測、基坑堆放檢測、臨邊洞口檢測和跌倒檢測,人貨梯區(qū)域有人數(shù)超載檢測,一旦發(fā)現(xiàn)異常情況系統(tǒng)會立刻發(fā)出警報促進問題解決。
在化工園區(qū),容聯(lián)已幫助多個化工園區(qū)完成視頻智能化升級改造
在生產(chǎn)車間、裝卸點、固定動火點等作業(yè)區(qū)域可以識別安全帽、工裝、反光衣等勞保用品佩戴情況,在罐區(qū)、?;穫}庫、配電房等重點區(qū)域一旦有外來闖入人員,可自動觸發(fā)系統(tǒng)告警,對于中控室等需要在崗值守場景,可自動識別睡崗、離崗等行為,對整個化工園區(qū)可24h自動識別煙霧火焰等目標,將事故隱患降至最低。
在智慧工廠領(lǐng)域,容聯(lián)產(chǎn)品已經(jīng)超越了安全檢測范圍,可以深入到生產(chǎn)流程檢測產(chǎn)品質(zhì)量。比如在與海爾工廠的合作中檢測范圍包括運輸越線、安全穿戴、工序流程和產(chǎn)品瑕疵,此前海爾合肥滾筒洗衣機廠年產(chǎn)洗衣機上百萬臺,因次品賠付超過千萬元。合作后該廠的違規(guī)操作、賠付成本都下降了30%,安全事故發(fā)生次數(shù)減少了50%。
在與某工廠合作項目中,慧眼可以檢測工廠和叉車人行道混亂、員工作業(yè)不規(guī)范、塔架坍塌和傳送帶停止等設(shè)備異常,讓工廠違規(guī)作業(yè)現(xiàn)象下降了30%,人力成本降低了10%,安全事故減少了50%。
在“明廚亮灶“領(lǐng)域,容聯(lián)也已具備完整的AI智能分析解決方案
對廚房操作間的人員行為進行智能識別,如后廚吃飯、抽煙、玩手機等行為;對于廚師衣著、帽子、口罩、手套等防護用具進行智能檢測;對于老鼠蟲害進行智能檢測。
當然,目前AI的技術(shù)不可能百分百實現(xiàn)用戶的所有場景需求,經(jīng)常會有技術(shù)無法處理的情況發(fā)生,比如智慧工地中的高空墜物問題,因物體速度下落太快,攝像頭難以精準捕捉到。不過,容聯(lián)針對行業(yè)的解決方案已經(jīng)可以解決特定應(yīng)用場景下80%以上的需求。
三、檢測準確率超過90%,容聯(lián)優(yōu)勢在哪?
相比于競爭對手,容聯(lián)產(chǎn)品的優(yōu)勢很明顯。前段時間做安全帽佩戴檢測的行業(yè)分析。許志強發(fā)現(xiàn),容聯(lián)產(chǎn)品準確率相比競品高出很多。容聯(lián)產(chǎn)品準確率超過90%,而對方誤檢率超過了一半。
為什么容聯(lián)會有這個優(yōu)勢?
算法落地行業(yè),其實算法本身差別并不大?!杆惴夹g(shù)的發(fā)展最先肯定是在學術(shù)界,每家企業(yè)只要對前沿技術(shù)盯得緊,都不會差太多?!乖S志強說。
容聯(lián)的優(yōu)勢就是在于針對特定場景的數(shù)據(jù)增強處理、AI和傳統(tǒng)技術(shù)的結(jié)合以及工程化處理技術(shù)。
AI算法極度依賴數(shù)據(jù),但是很多情況下數(shù)據(jù)采集又比較難,如火的素材采集,在正常的場景下很難出現(xiàn)這樣的素材,對于這類素材,容聯(lián)自有的數(shù)據(jù)增強處理技術(shù)可以在素材比較少的情況下獲得比較好的效果。
雖然深度學習在機器視覺的圖像分類、目標檢測、跟蹤等領(lǐng)域均有革命性的進展。但深度學習不可避免地依賴于訓(xùn)練數(shù)據(jù),且深度學習輸出結(jié)果中一般都有“閾值”限制,實際應(yīng)用中,很難設(shè)定適用于所有場景的統(tǒng)一閾值。
此時即需要結(jié)合傳統(tǒng)CV技術(shù),傳統(tǒng)技術(shù)的一般特點是通用性較強,結(jié)合深度學習后,可得到神經(jīng)網(wǎng)絡(luò)模型輸出的具有語義信息的結(jié)果,在保持通用性的同時提升精度。例如目標跟蹤場景,利用深度學習檢測圖像中特定種類物體位置,結(jié)合傳統(tǒng)背景建模、幀差法、光流法等,達到一定集成學習的效果。
目前AI技術(shù)在落地過程中仍然受到數(shù)據(jù)量、數(shù)據(jù)質(zhì)量、標注成本、數(shù)據(jù)域變化等問題的制約,單純依靠深度學習模型難以解決復(fù)雜場景下的實際CV問題。容聯(lián)具備一系列針對實際應(yīng)用場景的工程化優(yōu)化手段,包括圖像的時序分析機制、檢測目標屬性過濾機制、目標跟蹤及ReID機制等,提高算法在落地應(yīng)用時的精度。
另外,除了技術(shù)上的壁壘,容聯(lián)CV產(chǎn)品一個重要的壁壘還是其在行業(yè)中的積累,因為做某個行業(yè)的視頻識別本質(zhì)上就是還是拼行業(yè)數(shù)據(jù)的積累、以及對行業(yè)的理解力。
容聯(lián)本身是國內(nèi)最大的云通訊廠商,與多個行業(yè)內(nèi)的頭部客戶有密切聯(lián)系,容易獲取客戶信任。實際上容聯(lián)最開始做CV的契機就是客戶需求。
在實際操作中,準確洞悉行業(yè)痛點是一個周期很長且很重的事情。CV落地會碰見許多問題,在視頻源方面,客戶原本安裝的攝像頭可能會出現(xiàn)畫面被遮擋、光線變化大、距離較遠等問題,需要要跟客戶溝通調(diào)整。
另外理解客戶實際需求本身到真正的算法落地需要相當長的周期,短則三個月,長則半年,在這期間需要不斷和客戶磨合,根據(jù)實際情況調(diào)整算法。最后才能形成一個在行業(yè)里面能夠達到生產(chǎn)級別落地的算法模型。
對于創(chuàng)業(yè)公司和之前沒有相關(guān)資源積累的企業(yè)來說,很難獲取行業(yè)頭部企業(yè)的信任。并且頭部企業(yè)往往就是一個行業(yè)的標桿,在服務(wù)大客戶過程中會積累到很多行業(yè)數(shù)據(jù)和經(jīng)驗,提升算法精度,容易建立自身優(yōu)勢,優(yōu)勢又會帶來更多客戶,滾雪球式的筑起一個很高的壁壘。
容聯(lián)的標準化產(chǎn)品Aibox就是在服務(wù)不同行業(yè)客戶,積累許多數(shù)據(jù)模型的基礎(chǔ)上產(chǎn)生的。正是由于這些積累,容聯(lián)能在很短的時間內(nèi)做出優(yōu)于他人的產(chǎn)品demo,獲得客戶的青睞。
在未來,容聯(lián)打算繼續(xù)深耕垂直行業(yè),從「CV產(chǎn)品提供商」深入到「解決方案提供商」,與一些合作伙伴一起,提供「發(fā)現(xiàn)問題-解決問題」一體化服務(wù)。比如在智慧工地行業(yè)與合作伙伴一起提供CV增強的建筑工地信息化系統(tǒng),幫助企業(yè)更好的解決問題。
四、尾聲
當前國內(nèi)的AI技術(shù)已進入爆發(fā)式發(fā)展,但如何應(yīng)用落地還是亟待解決的問題,正如許志強所說,大多數(shù)行業(yè)對AI都沒有感知力。
研究一些成功的落地案例可發(fā)現(xiàn),AI作為一種高精尖技術(shù)自帶「不落凡塵」的氣質(zhì),但如果讓技術(shù)扎根落地,最重要的還是真正下沉產(chǎn)業(yè)。
也就是說,很多時候掌握技術(shù)只是一個基礎(chǔ),在此基礎(chǔ)上開發(fā)應(yīng)用還需要更多的思考與實踐。容聯(lián)的CV實踐無疑是提供了一個非常好的方向。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!
2023年7月6日,第六屆世界人工智能大會(WAIC2023)在上海開幕,“人工智能大模型”是本屆大會的備受矚目的話題,據(jù)悉,在昇騰AI大模型的創(chuàng)新研發(fā)中,華為聯(lián)手26家行業(yè)領(lǐng)軍企業(yè),組建了一支協(xié)同創(chuàng)新的“AI明星隊”,云天勵飛作為中國人工智能企業(yè)的杰出代表,和互聯(lián)網(wǎng)大廠、運營商、科研院所等優(yōu)秀團隊
這幾個月來,以ChatGPT為代表的生成式AI展現(xiàn)出的能力令世界驚嘆。自從2016年AlphaGo戰(zhàn)勝李世石掀起了一波AI浪潮后,AI仿佛已經(jīng)沉寂了很久,ChatGPT的橫空出世就如同一束耀眼的光芒,讓AI這個名詞重回C位。過去在AI1.0時代,主要通過訓(xùn)練模型來實現(xiàn)圖像識別、聲音識別、語言處理等特
文:互聯(lián)網(wǎng)江湖作者:志剛2023年的IoT需要一個新故事。6月29日,涂鴉智能在開發(fā)者大會上,發(fā)布了企業(yè)級戰(zhàn)略PaaS2.0,希望通過一個平臺+四大開發(fā)服務(wù),建立起IoT生態(tài)。對于這場發(fā)布會,市場的態(tài)度是積極的。美東時間6月29日收盤,涂鴉智能美股股價上漲5.6%,來到1.87美元/股。近日股價穩(wěn)定
美團曾經(jīng)的二號人物王慧文對標OpenAI的創(chuàng)業(yè)項目光年之外,以20億賣給美團,再度引發(fā)市場對大模型的熱議。
2020年底,王慧文在朋友圈寫下這句話時,外界本以為這位伴隨中國互聯(lián)網(wǎng)發(fā)展而持續(xù)創(chuàng)業(yè)20年的人物即將告別創(chuàng)業(yè)舞臺。但是,一個曾經(jīng)多次創(chuàng)業(yè),正值壯年的互聯(lián)網(wǎng)老將心中的創(chuàng)業(yè)熱情是難以熄滅的。
蘋果16弄了兩個版本,一個是專門給中國人用的,準備用百度的AI,還要交錢。第二個是全世界都可以用的,用了ChatGPT,包括臺灣、香港、澳門都可以用。以后都這樣了。好,問題就出在這,蘋果和百度的合作出現(xiàn)問題了,新聞連起來看,才能明白其中含義。新聞一:蘋果正在和騰訊、字節(jié)初步接洽,考慮將二者的AI模型
“技術(shù)日新月異,人類生活方式正在快速轉(zhuǎn)變,這一切給人類歷史帶來了一系列不可思議的奇點。我們曾經(jīng)熟悉的一切,都開始變得陌生?!庇嬎銠C之父約翰·馮·諾依曼曾這樣說到。
“人工智能的商業(yè)模式,是要創(chuàng)造一個市場,而非一個算法”。這是世界AI泰斗MichaelI.Jordan的觀點。而當前的全球AI市場,占據(jù)主導(dǎo)地位的中美雙方,卻也走出了兩條截然不同的技術(shù)路徑,前者執(zhí)著于前沿技術(shù)的探索,后者則發(fā)力應(yīng)用優(yōu)化和商業(yè)化落地。南轅北轍的兩個方向,或許已經(jīng)無法直接進行排位先后、優(yōu)
智能體進化發(fā)展了一年,現(xiàn)在的RPAAgent迭代到什么程度了?從實在智能最新發(fā)布的實在Agent7.0,看RPAAgent的迭代升級抓取豆瓣信息、自己制作PPT,這款A(yù)IAgent真的實現(xiàn)了流程全自動化AIAgent構(gòu)建到執(zhí)行全自動化,持續(xù)進化RPAAgent再次降低智能體應(yīng)用門檻實在智能重磅發(fā)布實
崔大寶|節(jié)點財經(jīng)創(chuàng)始人進入2024年,大模型似乎有熄火之勢:資本市場,與之關(guān)聯(lián)的概念炒不動了,英偉達股價動輒暴跌重挫,引發(fā)“泡沫戳破”的擔憂;消費市場,BATH們的推新活動少了,產(chǎn)品更新迭代的速度慢了,民眾的關(guān)注度降了……熱鬧的大概只剩下兩場酣仗:自5月15日字節(jié)跳動宣布“以厘計費”,打響國內(nèi)大模型
文|智能相對論作者|陳泊丞好消息!你心心念念的事業(yè)單位發(fā)錄取公告了!壞消息!他們沒錄你,錄了個數(shù)字人。圖片來源網(wǎng)絡(luò)隨著數(shù)字人技術(shù)的突破,越來越多的傳統(tǒng)企業(yè)和機構(gòu)開始用上了“數(shù)字員工”。甚至很多中國人心心念念的“鐵飯碗”,也被這些數(shù)字人給捧上了。數(shù)字人捧上了“鐵飯碗”簡單翻看一下全國各地事業(yè)單位的“錄
黑芝麻智能敲鐘后,港交所門口又有一些智駕芯片企業(yè)引發(fā)關(guān)注。據(jù)悉,近日地平線已通過中國證監(jiān)會IPO備案,擬發(fā)行不超過11.5億股境外上市普通股并在香港聯(lián)合交易所上市,預(yù)計籌集約5億美元資金。從天眼查可以了解到,該公司成立于2015年,是一家乘用車高級輔助駕駛(ADAS)和高階自動駕駛(AD)解決方案供
8月21日,萬眾矚目的2024世界機器人大會暨博覽會在北京亦創(chuàng)國際會展中心盛大開幕。這場為期5天,集“展覽”“論壇”“賽事”于一體的機器人盛會,反映了當下機器人領(lǐng)域的繁榮生態(tài)。據(jù)官方統(tǒng)計數(shù)據(jù),今年現(xiàn)場逛展觀眾高達25萬人次,比去年增加25%。機器人行業(yè)有多火?看看2024世界機器人大會火爆程度便可知