1. 創(chuàng)業(yè)頭條
  2. 前沿領(lǐng)域
  3. 人工智能
  4. 正文

李明強(qiáng):AI鑒黃師"看懂"圖像迅速走紅

 2018-09-11 18:12  來源:互聯(lián)網(wǎng)  我來投稿 撤稿糾錯(cuò)

  域名預(yù)訂/競(jìng)價(jià),好“米”不錯(cuò)過

受訪者供圖

“你的第一個(gè)產(chǎn)品,哪怕做得粗糙一點(diǎn)也沒關(guān)系,不要想太多!”5年前,李明強(qiáng)帶著騰訊高級(jí)副總裁張小龍的“臨別贈(zèng)言”,躍入創(chuàng)業(yè)的大潮中。共事多年的張小龍給他的建議是,“產(chǎn)品并不需要做得完美無瑕再拿出去。只要有客戶,就說明是有需求的。”

1980年出生的李明強(qiáng)在騰訊工作了7年,先后參與QQ郵箱、微信等項(xiàng)目的開發(fā),成了一名資深的項(xiàng)目經(jīng)理和T4技術(shù)專家。“我離開騰訊時(shí),公司只有幾十個(gè)T4技術(shù)專家。但我在那里太久了,再不出去創(chuàng)業(yè)就折騰不動(dòng)了。”2014年,他創(chuàng)辦了國內(nèi)最早將計(jì)算機(jī)視覺技術(shù)應(yīng)用在互聯(lián)網(wǎng)內(nèi)容審核上的AI公司——圖普科技。

“內(nèi)容審查怎么不能做到?我就可以做!”

圖普科技從“出生”時(shí)起,就打上了“鑒黃”的烙印。這源于曾經(jīng)掀起輿論熱議的“快播案”??觳EO王欣在法庭上稱:“快播最主要的功能就是播放,就像傳統(tǒng)意義上的DVD,無法知道上傳者是誰,更不知道視頻內(nèi)容是什么。用戶上傳什么種子,它就播放下載什么種子,它只是忠實(shí)地執(zhí)行這個(gè)動(dòng)作而已。”

李明強(qiáng)說:“內(nèi)容審查在當(dāng)時(shí)的確很難。我就想怎么不能做到?我就可以做!”

根據(jù)《全國人民代表大會(huì)常務(wù)委員會(huì)關(guān)于維護(hù)互聯(lián)網(wǎng)安全的決定》的規(guī)定,互聯(lián)網(wǎng)公司內(nèi)容涉黃,有可能被以制作、復(fù)制、出版、販賣、傳播淫穢物品牟利罪定罪處罰??觳テ飘a(chǎn)的結(jié)局讓眾多網(wǎng)絡(luò)平臺(tái)意識(shí)到,內(nèi)容審核不僅是維護(hù)互聯(lián)網(wǎng)環(huán)境的政策要求,更是關(guān)及自身生死存亡的要事。

如今,直播和短視頻市場(chǎng)風(fēng)起云涌,龐大的流量催生新產(chǎn)業(yè)的同時(shí),審核難度也越來越大。據(jù)新華社報(bào)道,今年以來,“掃黃打非”部門加大工作力度。據(jù)統(tǒng)計(jì),“凈網(wǎng)2018”行動(dòng)從1月到4月,各地共處置淫穢色情等有害信息175萬余條,查辦淫穢色情信息案件390余起。

被網(wǎng)友戲稱高薪和“福利”兼具的神奇職業(yè)“鑒黃師”,在如此大體量的內(nèi)容檢測(cè)面前顯得勢(shì)單力薄。“培養(yǎng)一個(gè)鑒黃師至少需要兩周。”李明強(qiáng)說,“一天總共8萬多秒,去掉吃飯睡覺等時(shí)間,鑒黃師一天最多能看一兩萬張圖片。人工審核難免會(huì)有錯(cuò)漏,還要考慮人員流動(dòng)、不能實(shí)時(shí)監(jiān)看等不穩(wěn)定的因素。”

受到快播案的啟發(fā),李明強(qiáng)確立了用人工智能技術(shù)進(jìn)行圖片識(shí)別的戰(zhàn)略,他帶著新建的團(tuán)隊(duì),在一周內(nèi)做出demo(小樣),在給機(jī)器提供大量數(shù)據(jù)的基礎(chǔ)上,通過機(jī)器持續(xù)學(xué)習(xí),確保系統(tǒng)甄別效能的更新和優(yōu)化。

隨后圖普迎來第一個(gè)客戶——迅雷。迅雷之前成立了自己的內(nèi)容審核團(tuán)隊(duì)。“他們的做法是將違規(guī)內(nèi)容和審核視頻進(jìn)行比對(duì),將一樣的部分篩去,但是機(jī)器并不理解這個(gè)東西是什么。”李明強(qiáng)說,“一個(gè)視頻版本傳播出去會(huì)有多個(gè)變種,分辨率不同、加個(gè)水印、字幕或者截取部分,就演變成完全不同的文件了。我們的創(chuàng)新點(diǎn)在于,我們的識(shí)別是基于圖像的理解,真的能‘看懂’視頻是否有色情內(nèi)容”。

“我們?cè)谧R(shí)別的結(jié)果上,會(huì)劃線區(qū)分為確定和不確定部分。有的圖片非常隱晦,它介于兩者之間,系統(tǒng)的判定是不確定或者很模糊。因此我們也設(shè)立新的計(jì)費(fèi)模式,只對(duì)于確定部分收費(fèi),不確定部分不收費(fèi)或者少收費(fèi),打消客戶的很多疑慮。”李明強(qiáng)解釋,圖普科技的準(zhǔn)確率高達(dá)99%,對(duì)于系統(tǒng)無法識(shí)別或無法作出最終判斷的內(nèi)容,推送至人工審核。盡管還需要鑒黃師的助力,但已經(jīng)極大地提高效率和降低人力成本。

目前,圖普科技的AI每天的處理量超過10億次,在云端設(shè)有幾百個(gè)圖像識(shí)別接口,相關(guān)的算法也落地到不同的行業(yè)里。

“每次嘗試我都更興奮,會(huì)有這一次要成功了的錯(cuò)覺”

任何成功都不是一蹴而就。在圖普科技成長為“AI鑒黃師”之前,李明強(qiáng)有過一次失敗的創(chuàng)業(yè)經(jīng)歷。

2013年,李明強(qiáng)嘗試開發(fā)一個(gè)服裝和鞋帽的搜索引擎,通過圖片來了解用戶喜好并推薦適合用戶的款式。“在當(dāng)時(shí)就能夠完成識(shí)別圖中衣物款式、顏色、紋理等一些當(dāng)時(shí)看起來很有難度的事”,但初次創(chuàng)業(yè)不過一年便宣告失敗。

李明強(qiáng)期望能從圖片為切口,突破單一的純文字搜索引擎模式,但高成本的流量和時(shí)間消耗難以承受?;仡欉^去的創(chuàng)業(yè)經(jīng)歷,運(yùn)營工作太重是失敗的主要原因。用戶對(duì)于服裝的偏好、對(duì)美的感受千差萬別,需要進(jìn)行大量的運(yùn)營工作。

這成為李明強(qiáng)最頭痛的事,“盡管我們嘗試將每一次需求沉淀下來再去改進(jìn),但還是會(huì)有新的或者隱晦的需求,一次又一次遭受打擊。依靠技術(shù)難以量化和把握,無法完成完整的商業(yè)閉環(huán)。”

“這是一次非常慘痛的創(chuàng)業(yè)經(jīng)歷。”從騰訊的高級(jí)技術(shù)專家,到事無巨細(xì)考慮每一步的創(chuàng)業(yè)老板,身份的轉(zhuǎn)換帶給了李明強(qiáng)極大的不適應(yīng)感,“就像一覺醒來漂流在海面上,狂風(fēng)暴雨,又不知道該往什么方向去走。”

當(dāng)初,李明強(qiáng)帶著幾位伙伴一起離開騰訊著手創(chuàng)業(yè)。他形容“自己的兄弟特別單純”,“他們就相信我這件事情能做成”。

搜衣引擎的失敗給了李明強(qiáng)當(dāng)頭一棒。比起自己的挫敗感,李明強(qiáng)對(duì)共同戰(zhàn)斗的隊(duì)友背負(fù)更深的愧疚。

“帶著一幫兄弟,拿著投資人的錢花時(shí)間在這個(gè)地方,最后發(fā)現(xiàn)都是一些無效勞動(dòng)。”那一次失敗,讓李明強(qiáng)損失了一半得力干將。他覺得,“失敗就像一個(gè)坑,陷進(jìn)去了就得爬出來。如何找到方向爬出坑最重要”。

“就是不斷嘗試。”李明強(qiáng)在接受中國青年報(bào)·中青在線記者采訪時(shí)說,“每一次嘗試我都更興奮,會(huì)有這一次要成功了的錯(cuò)覺,但結(jié)果方向又不對(duì),那就再來!”

每一次調(diào)整狀態(tài)后,他又像打滿了雞血一般,迎接新的挑戰(zhàn),“這件事情一年做不成,我就做十年。因?yàn)槲抑揽隙ㄊ谴嬖谝粭l路的。”李明強(qiáng)終于找到了這條路,開創(chuàng)了國內(nèi)人工智能圖片識(shí)別內(nèi)容審核的先河。

員工的學(xué)習(xí)時(shí)間計(jì)入工時(shí)——拿工資學(xué)習(xí)

“AI鑒黃師”迅速走紅。參加了多場(chǎng)人工智能研討會(huì)后,李明強(qiáng)發(fā)現(xiàn),“只要一說我們的產(chǎn)品是AI鑒黃,之后再說到其他業(yè)務(wù)大家就都不注意聽了”。

“后來想想我們本來就是互聯(lián)網(wǎng)出身,能有這樣的免費(fèi)熱點(diǎn)蹭,也沒什么不好。 ”李明強(qiáng)介紹,如今圖普科技三條生產(chǎn)線并行:互聯(lián)網(wǎng)、商業(yè)智能、泛安防。鑒黃只是互聯(lián)網(wǎng)生產(chǎn)線的一個(gè)小分支。今年圖普科技在商業(yè)智能上持續(xù)發(fā)力,線下門店都開始嘗試配備AI的自動(dòng)導(dǎo)購機(jī),例如通過攝像頭來識(shí)別消費(fèi)者的形象特征,隨后根據(jù)算法在屏幕上顯示推薦產(chǎn)品,在應(yīng)用中增添很多趣味性的成分,“這實(shí)際上是我們做賦能型零售的破冰嘗試。”

目前,圖普科技總部設(shè)在廣州,在北京、成都等地開設(shè)了分公司,160多人的團(tuán)隊(duì)中研發(fā)人員占70%。招到優(yōu)秀的人是李明強(qiáng)最關(guān)心的事,他和程序員在工作之余“玩”出了5套謎題,以游戲的形式作為選拔人才的考卷。

“這一套謎題是用算法摳出圖里的馬里奧,這張海報(bào)的圖標(biāo)是《三體》里的魚缸……”他甚至在公司開設(shè)解題課堂,定期講解這些內(nèi)容。他還設(shè)計(jì)了打卡學(xué)習(xí)系統(tǒng),員工的學(xué)習(xí)時(shí)間計(jì)入工時(shí)——拿工資學(xué)習(xí)。

如今,李明強(qiáng)和公司成員溝通時(shí),常常將“在用的過程中完善”這句話掛在嘴邊。李明強(qiáng)坦言,“我一開始總想要把產(chǎn)品做完善再拿出去,反而越做越糟。張小龍的忠告是對(duì)的,產(chǎn)品就是應(yīng)該在推出后根據(jù)需求迭代的。我們也正在不斷更新產(chǎn)品,永遠(yuǎn)在路上。”(實(shí)習(xí)生 黃暢 中國青年報(bào)·中青在線記者 王聰聰)

申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)文章

  • 庫克已納投名狀:蘋果AI沒得選,只能選百度

    蘋果16弄了兩個(gè)版本,一個(gè)是專門給中國人用的,準(zhǔn)備用百度的AI,還要交錢。第二個(gè)是全世界都可以用的,用了ChatGPT,包括臺(tái)灣、香港、澳門都可以用。以后都這樣了。好,問題就出在這,蘋果和百度的合作出現(xiàn)問題了,新聞連起來看,才能明白其中含義。新聞一:蘋果正在和騰訊、字節(jié)初步接洽,考慮將二者的AI模型

    標(biāo)簽:
    蘋果AI
    百度AI
    庫克
  • AI加速時(shí)代的“進(jìn)度條”,我們撥動(dòng)了百分之幾?

    “技術(shù)日新月異,人類生活方式正在快速轉(zhuǎn)變,這一切給人類歷史帶來了一系列不可思議的奇點(diǎn)。我們?cè)?jīng)熟悉的一切,都開始變得陌生。”計(jì)算機(jī)之父約翰·馮·諾依曼曾這樣說到。

    標(biāo)簽:
    ai智能
  • AI視頻賽道,要變天了

    “毀滅你,與你何干?”,這是在劉慈欣的科幻小說《三體》里用來形容人類與三體人之間的戰(zhàn)爭(zhēng)的一句話。

    標(biāo)簽:
    ai智能
  • “創(chuàng)造市場(chǎng)”與“算法進(jìn)化”,中美AI競(jìng)速的岔路口

    “人工智能的商業(yè)模式,是要?jiǎng)?chuàng)造一個(gè)市場(chǎng),而非一個(gè)算法”。這是世界AI泰斗MichaelI.Jordan的觀點(diǎn)。而當(dāng)前的全球AI市場(chǎng),占據(jù)主導(dǎo)地位的中美雙方,卻也走出了兩條截然不同的技術(shù)路徑,前者執(zhí)著于前沿技術(shù)的探索,后者則發(fā)力應(yīng)用優(yōu)化和商業(yè)化落地。南轅北轍的兩個(gè)方向,或許已經(jīng)無法直接進(jìn)行排位先后、優(yōu)

    標(biāo)簽:
    ai智能
  • 智能體進(jìn)化發(fā)展了一年,現(xiàn)在的RPA Agent迭代到什么程度了?

    智能體進(jìn)化發(fā)展了一年,現(xiàn)在的RPAAgent迭代到什么程度了?從實(shí)在智能最新發(fā)布的實(shí)在Agent7.0,看RPAAgent的迭代升級(jí)抓取豆瓣信息、自己制作PPT,這款A(yù)IAgent真的實(shí)現(xiàn)了流程全自動(dòng)化AIAgent構(gòu)建到執(zhí)行全自動(dòng)化,持續(xù)進(jìn)化RPAAgent再次降低智能體應(yīng)用門檻實(shí)在智能重磅發(fā)布實(shí)

  • 崔大寶:大模型降溫背后的難點(diǎn)、卡點(diǎn)、節(jié)點(diǎn)

    崔大寶|節(jié)點(diǎn)財(cái)經(jīng)創(chuàng)始人進(jìn)入2024年,大模型似乎有熄火之勢(shì):資本市場(chǎng),與之關(guān)聯(lián)的概念炒不動(dòng)了,英偉達(dá)股價(jià)動(dòng)輒暴跌重挫,引發(fā)“泡沫戳破”的擔(dān)憂;消費(fèi)市場(chǎng),BATH們的推新活動(dòng)少了,產(chǎn)品更新迭代的速度慢了,民眾的關(guān)注度降了……熱鬧的大概只剩下兩場(chǎng)酣仗:自5月15日字節(jié)跳動(dòng)宣布“以厘計(jì)費(fèi)”,打響國內(nèi)大模型

    標(biāo)簽:
    大模型
  • 這一屆“出道”的數(shù)字人,已經(jīng)拿捧上了“鐵飯碗”

    文|智能相對(duì)論作者|陳泊丞好消息!你心心念念的事業(yè)單位發(fā)錄取公告了!壞消息!他們沒錄你,錄了個(gè)數(shù)字人。圖片來源網(wǎng)絡(luò)隨著數(shù)字人技術(shù)的突破,越來越多的傳統(tǒng)企業(yè)和機(jī)構(gòu)開始用上了“數(shù)字員工”。甚至很多中國人心心念念的“鐵飯碗”,也被這些數(shù)字人給捧上了。數(shù)字人捧上了“鐵飯碗”簡單翻看一下全國各地事業(yè)單位的“錄

    標(biāo)簽:
    數(shù)字人
  • 來到IPO關(guān)口,地平線離“三分天下”還有多遠(yuǎn)?

    黑芝麻智能敲鐘后,港交所門口又有一些智駕芯片企業(yè)引發(fā)關(guān)注。據(jù)悉,近日地平線已通過中國證監(jiān)會(huì)IPO備案,擬發(fā)行不超過11.5億股境外上市普通股并在香港聯(lián)合交易所上市,預(yù)計(jì)籌集約5億美元資金。從天眼查可以了解到,該公司成立于2015年,是一家乘用車高級(jí)輔助駕駛(ADAS)和高階自動(dòng)駕駛(AD)解決方案供

  • 機(jī)器人大會(huì)引領(lǐng)產(chǎn)業(yè)動(dòng)向,卓翼飛思繪制無人系統(tǒng)教科研新藍(lán)圖

    8月21日,萬眾矚目的2024世界機(jī)器人大會(huì)暨博覽會(huì)在北京亦創(chuàng)國際會(huì)展中心盛大開幕。這場(chǎng)為期5天,集“展覽”“論壇”“賽事”于一體的機(jī)器人盛會(huì),反映了當(dāng)下機(jī)器人領(lǐng)域的繁榮生態(tài)。據(jù)官方統(tǒng)計(jì)數(shù)據(jù),今年現(xiàn)場(chǎng)逛展觀眾高達(dá)25萬人次,比去年增加25%。機(jī)器人行業(yè)有多火?看看2024世界機(jī)器人大會(huì)火爆程度便可知

編輯推薦