1. 創(chuàng)業(yè)頭條
  2. 前沿領(lǐng)域
  3. AI智能
  4. 正文

聲音鑒黃師飽受摧殘,AI聲音鑒黃師為何沒幫上忙?

 2018-09-26 14:11  來源:A5專欄  我來投稿 撤稿糾錯(cuò)

  一鍵部署OpenClaw

文|雷宇

來源|智能相對論(aixdlun)

人民對性的態(tài)度向來很奇怪,父母和長輩期待子女能無師自通,教育者三緘其口,最后少男少女通過其他渠道實(shí)現(xiàn)了對性的初級摸索,當(dāng)然這個(gè)摸索過程就很曲折了,文字,圖片,視頻和音頻遍地開花,“學(xué)習(xí)資料”越來越方便傳播。

食也性也,但傳播色情內(nèi)容卻有極大的負(fù)外部效應(yīng),懵懂少男少女極易受其蠱惑,鑒黃師的重要性可想而知。在蘋果商店的社交App中,有超過1/10的應(yīng)用主打聲音社交功能,由此催生出了一個(gè)新興職業(yè)——聲音鑒黃師。聲音鑒黃師是一個(gè)讓身心飽受摧殘的職業(yè),一位女性聲音鑒黃師稱,“一個(gè)人平均一天需要鑒定4000條信息,24小時(shí)輪班監(jiān)控,各種葷段子、曖昧語音,有時(shí)(聽到)惡心想吐。”

聲音鑒黃師是一份不足以為外人道也的工作

由于這份工作實(shí)在是太過于枯燥,很多男生都受不了,因此聲音鑒黃師多為女性且離職率高。一般枯燥且重復(fù)率高的工作都是AI的拿手好戲,那么AI有沒有辦法實(shí)現(xiàn)聲音鑒黃呢?

聲音鑒黃之殤,AI難以克服雞尾酒效應(yīng)

視頻,圖片和語音是色情內(nèi)容常見的三種形式,多數(shù)公司的鑒黃都是立足于視頻和圖片,比如阿里的阿里綠網(wǎng)、騰訊的萬象優(yōu)圖等等。有人可能會(huì)疑問,這幾年科大訊飛、百度、騰訊等公司先后對外公布語音識別準(zhǔn)確率均達(dá)到“97%”,那為什么在AI語音鑒黃上那么難?

這是因?yàn)樯缃黄脚_(tái)的語音環(huán)境十分復(fù)雜,機(jī)器很難從龐大雜亂的語音中揪出涉黃涉暴人員,而這就不得不提雞尾酒效應(yīng)了。所謂雞尾酒效應(yīng)是指,在雞尾酒會(huì)嘈雜的人群中,盡管周圍噪聲很大,兩人可以順利交談,你們似乎聽不到談話內(nèi)容以外的各種噪音。這是因?yàn)槲覀兊拇竽X對聲音都進(jìn)行了某種程度的預(yù)判,然后才決定聽或不聽。

用特瑞斯曼的注意衰減理論來解釋就是,當(dāng)人的聽覺注意集中于某一事物時(shí),意識將一些無關(guān)聲音刺激排除在外,而無意識卻監(jiān)察外界的刺激,一旦一些特殊的刺激與己有關(guān),就能立即引起注意的現(xiàn)象。

但是機(jī)器卻不具備這樣意識和無意識,因此難以實(shí)現(xiàn)在嘈雜環(huán)境下的語音識別,這樣看來AI語音鑒黃貌似已經(jīng)走進(jìn)了死胡同。

實(shí)際上,已有公司在解決雞尾酒效應(yīng)上做出了努力。今年4 月,Google曾在博客上發(fā)文稱,谷歌研究人員開發(fā)出了一種深度學(xué)習(xí)系統(tǒng),可識別和分離出嘈雜環(huán)境中的個(gè)體聲音。

研究人員從YouTube上10萬段“講座和談話”視頻中提取了近2000小時(shí)的視頻片段,然后混合音頻與人工背景噪聲,創(chuàng)造“雞尾酒派對”。訓(xùn)練技術(shù)人員將混合音頻進(jìn)行拆分,谷歌的系統(tǒng)能夠分辨出哪個(gè)音頻源在給定的時(shí)間內(nèi)屬于哪張人臉,并為每個(gè)揚(yáng)聲器創(chuàng)建單獨(dú)的語音軌跡。

但Google的技術(shù)集中在視頻處理上,主要是對數(shù)段聲音的分離,而人工聲音鑒黃僅僅依靠聲音,有所不同。前不久,阿里AI語音反垃圾服務(wù)上線公測,它可以通過聲紋識別技術(shù),識別語音中存在的涉黃、廣告等違規(guī)信息,不管是中日英俄等語言,還是東北,四川,廣東的方言,甚至連無意義的*聲都可以輕松判別。

具體辦法是,對那些有語義的內(nèi)容,系統(tǒng)先將語音識別轉(zhuǎn)成文字,然后再將這些文字跟文本反垃圾模型或關(guān)鍵詞庫比對,判斷是否涉黃,對那些無語義的聲音,通過聲紋也能識別出來。但有一點(diǎn)值得注意的是,在語音識別的過程中,識別是哪種語言比內(nèi)容更難,機(jī)器翻譯也存在這樣的問題,因此還需要大量數(shù)據(jù)來進(jìn)行訓(xùn)練學(xué)習(xí)。

做好嘈雜環(huán)境的語音識別,難點(diǎn)是如何將雜音與人聲分離。但對于聲音鑒黃而言,一開始并不知道哪一個(gè)音源涉黃,很難說誰是噪音,這需要機(jī)器具有全局觀。而上面提到的技術(shù),聲音分離或者將語音識別轉(zhuǎn)成文字都只是基本,由于尚未在語音復(fù)雜的環(huán)境下試驗(yàn)過,因此這個(gè)結(jié)果嘛……退一萬步講,社交黑話也并不是那么好破譯的。

社交黑話難解,語音識別障礙重重

時(shí)代要拋棄你,它只會(huì)讓你看不懂,而我們也不能指望人工智能聽懂。

就像你爹媽當(dāng)初看不懂你的那句簽名:”ァ亊實(shí)證明,鱤綪桱淂起fеηɡ雨,卻桱囨起平啖;伖綪桱淂起平啖,卻桱囨起fеηɡ雨。ヤ”(沒亂碼),新一代社交黑話崛起一般人也很難看懂,比如XSWL(笑死我了,相當(dāng)于一連串哈哈哈),NSS(暖說說,指幫點(diǎn)贊評論轉(zhuǎn)發(fā)說說,增進(jìn)感情),CQY(處Q友的縮寫,想在QQ上找朋友的意思)。

當(dāng)然這也還算好的,無非就是縮寫。除了縮寫,還有一些只能強(qiáng)記的詞語。比如養(yǎng)火(互發(fā)消息三天出現(xiàn)小火花,互發(fā)消息超過三十天出現(xiàn)大火花,養(yǎng)火就是經(jīng)常聯(lián)系的意思),歐洲(想要什么就得到什么的人)……

估計(jì)研究人員在錄入數(shù)據(jù)時(shí)就陣亡了,畢竟這玩意看上去也不算有章可循。值得注意的是,當(dāng)人們在說話的時(shí)候,如果省略一兩個(gè)字不說,懂得的人自然也懂,但機(jī)器不一定能識別人們甚至為了混淆視聽,會(huì)多語夾雜,這就給機(jī)器識別增添了難度。

這種輸入標(biāo)準(zhǔn)的不統(tǒng)一,是導(dǎo)致語音識別錯(cuò)誤率高的首要原因。我們常用的鼠標(biāo)和鍵盤雖然看似簡單,但它具備統(tǒng)一的輸入標(biāo)準(zhǔn)和精準(zhǔn)的視覺反饋這兩點(diǎn),而這正是語音識別技術(shù)不具備的,也是困擾現(xiàn)階段AI鑒黃的一大挑戰(zhàn)。

毫不意外,現(xiàn)階段的聲音鑒黃師依然是以人為主。早在互聯(lián)網(wǎng)發(fā)展早期,黃色內(nèi)容主要是圖片和文字,靠人工就可以凈化網(wǎng)絡(luò)環(huán)境的目的,但是隨著互聯(lián)網(wǎng)帶來的數(shù)據(jù)爆炸,人工已經(jīng)遠(yuǎn)遠(yuǎn)不能勝任。

雖然聲音鑒黃以人為本,但這并不意味著AI鑒黃師沒有價(jià)值。它能在特定的場景實(shí)現(xiàn)鑒定也無疑算是一種進(jìn)步,而現(xiàn)階段它所呈現(xiàn)的問題,也無疑是技術(shù)發(fā)展過程中難以避免的陣痛。

全球經(jīng)濟(jì)學(xué)家和咨詢公司的主流研究課題,總少不了人工智能會(huì)引發(fā)的失業(yè)規(guī)模,但是中國的互聯(lián)網(wǎng)已經(jīng)跑出了一條獨(dú)特的路線,因此針對中國的研究少之又少。聲音鑒黃師作為互聯(lián)網(wǎng)發(fā)展過程中的獨(dú)特產(chǎn)物,顯然會(huì)存在相當(dāng)長一段時(shí)間,而現(xiàn)行的人工智能鑒黃也多為輔助人。

一句正確但無用的話是,可以想見未來AI鑒黃會(huì)占據(jù)主流,但這個(gè)未來應(yīng)該以哪個(gè)時(shí)間節(jié)點(diǎn)為基準(zhǔn),誰也無法預(yù)料。

智能相對論(微信id:aixdlun):深挖人工智能這口井,評出咸淡,講出黑白,道出vb深淺。重點(diǎn)關(guān)注領(lǐng)域:AI+醫(yī)療、機(jī)器人、智能駕駛、AI+硬件、物聯(lián)網(wǎng)、AI+金融、AI+安全、AR/VR、開發(fā)者以及背后的芯片、算法、人機(jī)交互等。

申請創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)標(biāo)簽
ai技術(shù)
ai智能
聲音鑒黃師審核

相關(guān)文章

  • 甌江論道:AI賦能綠色發(fā)展

    2025年10月25日,2025世界青年科學(xué)家峰會(huì)之人工智能(AI)融合創(chuàng)新發(fā)展論壇在浙江溫州成功舉辦。本次論壇由國際院士科創(chuàng)中心主辦,中國投資協(xié)會(huì)能源投資專業(yè)委員會(huì)、溫港院士科創(chuàng)中心承辦,中國電工技術(shù)學(xué)會(huì)、中科先進(jìn)技術(shù)溫州研究院與溫州市電力工程學(xué)會(huì)提供支持,以“甌江論道-AI賦能綠色發(fā)展”為主題,

    標(biāo)簽:
    ai技術(shù)
  • 王通:未來個(gè)人創(chuàng)業(yè)的十個(gè)機(jī)會(huì)

    個(gè)人創(chuàng)業(yè)需要啟動(dòng)成本低、無需龐大團(tuán)隊(duì)、可快速驗(yàn)證、能利用個(gè)人技能或資源。這里分享適合個(gè)人創(chuàng)業(yè)的十個(gè)機(jī)會(huì)一.AI內(nèi)容優(yōu)化與本地化服務(wù)·做什么:幫助企業(yè)或個(gè)人利用AI工具(如GPT-4,Midjourney)優(yōu)化內(nèi)容生產(chǎn)流程。例如,為跨境電商撰寫多語言產(chǎn)品描述,為小紅書博主生成爆款文案,為小公司制作營銷

  • Figma股價(jià)熱情僅存1天,AI焦慮成關(guān)鍵隱憂?

    文/道哥美國設(shè)計(jì)軟件公司Figma近期在紐約證券交易所掛牌上市,首日即上演“狂飆”行情——發(fā)行價(jià)定每股33美元,開盤報(bào)價(jià)85美元,較發(fā)行價(jià)翻倍。首日收報(bào)115.50美元,較發(fā)行價(jià)大漲約250%,市值飆升至近670億美元,創(chuàng)下近30年來同等規(guī)模美股IPO的最大單日漲幅紀(jì)錄。然而,隨著短線資金獲利了結(jié),

    標(biāo)簽:
    ai智能
  • AI「帶飛」騰訊業(yè)績

    文/一燈來源/節(jié)點(diǎn)財(cái)經(jīng)在當(dāng)前無人敢缺席的AI軍備競賽中,巨頭們一面為巨額的資本支出焦慮,一面又向市場勾勒著未來的宏偉藍(lán)圖。在各家動(dòng)輒千億級投入的背景下,市場迫切需要一份關(guān)于AI回報(bào)價(jià)值的有力證明。而騰訊,率先給出了答卷。8月13日,騰訊控股發(fā)布2025年第二季度財(cái)報(bào)。盡管資本開支同比劇增119%,達(dá)

    標(biāo)簽:
    ai智能
    騰訊
  • Meta用億元薪酬發(fā)起「人才狙擊」能否買來一個(gè)AI未來?

    文/二風(fēng)來源/節(jié)點(diǎn)財(cái)經(jīng)2025年的硅谷,一場沒有硝煙的戰(zhàn)爭正以前所未有的烈度上演。這場戰(zhàn)爭的核心武器不是代碼或芯片,而是人——那些全球僅有數(shù)千名、能夠構(gòu)建未來人工智能基礎(chǔ)模型的頂尖大腦。在這場激烈的人才爭奪戰(zhàn)中,Meta及其首席執(zhí)行官馬克·扎克伯格(MarkZuckerberg)正扮演著最具侵略性的

    標(biāo)簽:
    ai智能
  • 養(yǎng)openclaw小龍蝦,每月要花多少錢才能養(yǎng)好?

    “養(yǎng)龍蝦”到底要花多少錢?這個(gè)問題可能是大家最關(guān)心的。我們把成本拆成三部分:服務(wù)器租用費(fèi)+大模型API調(diào)用費(fèi)+雜項(xiàng)開銷。第一部分:服務(wù)器租用費(fèi)。最省錢的方案當(dāng)然是本地舊電腦自托管——零新增成本,電費(fèi)忽略不計(jì)。但如前所述,你需要接受“不是7×24小時(shí)在線”的局限性。如果選擇云服務(wù)器,成本差異就很大了。

  • 養(yǎng)小龍蝦用個(gè)人電腦還是云服務(wù)器?先搞清楚OpenClaw到底是什么

    不少朋友第一次接觸OpenClaw時(shí),都會(huì)有一個(gè)相同的困惑:這玩意兒到底該裝在哪里?OpenClaw(社區(qū)戲稱“養(yǎng)龍蝦”,因Logo為龍蝦鉗)不是普通的聊天機(jī)器人,而是一款本地優(yōu)先、可自主執(zhí)行、支持多Agent分工協(xié)作的AI執(zhí)行網(wǎng)關(guān)。說白了,它讓大模型從“只會(huì)說話”變成“會(huì)動(dòng)手做事”——幫你管理文件

  • AI龍蝦養(yǎng)了這么久,這8個(gè)建議你一定要聽

    01別相信“一鍵養(yǎng)蝦,躺平賺錢”的鬼話打開社交媒體,你可能會(huì)看到這樣的標(biāo)題:“養(yǎng)只龍蝦自動(dòng)炒股,零代碼養(yǎng)出數(shù)字巴菲特!”信了,你就輸了。真實(shí)情況是:一個(gè)做跨境電商的小哥花了200元租服務(wù)器、訂閱API,指望龍蝦幫他炒股暴富。結(jié)果龍蝦開始幾天還像模像樣,后來直接擺爛,生成個(gè)干癟的大綱就敷衍了事。AI是

  • “養(yǎng)龍蝦”火了,可你養(yǎng)的“蝦”要是闖了禍,責(zé)任到底算誰的?

    一張證書引發(fā)的討論4月7日,北京嫣然天使兒童醫(yī)院給陳光標(biāo)發(fā)了一張感謝證書,感謝他捐贈(zèng)1000萬元。這事說起來挺曲折的。此前陳光標(biāo)高調(diào)說要贈(zèng)給張雪一臺(tái)價(jià)值1300萬元的勞斯萊斯,張雪回應(yīng)“收了,八折賣掉捐給嫣然”,一番拉扯之后,陳光標(biāo)把車變現(xiàn),1000萬元直接打到了嫣然醫(yī)院賬上。醫(yī)院發(fā)證書感謝,本來是

  • 國家安全部發(fā)布Token安全警示:需高度警惕數(shù)據(jù)泄露與金融詐騙風(fēng)險(xiǎn)

    2026年4月7日,國家安全部就AI核心術(shù)語“詞元”(Token)發(fā)布安全警示,強(qiáng)調(diào)在日均調(diào)用量突破140萬億規(guī)模的市場背景下,需高度警惕由此引發(fā)的數(shù)據(jù)泄露與金融詐騙風(fēng)險(xiǎn)。據(jù)統(tǒng)計(jì),截至今年3月,我國日均詞元調(diào)用量已超過140萬億,較2024年初增長1000多倍。詞元作為大模型處理信息的最小單元,兼具

  • 中國AI大模型連續(xù)五周領(lǐng)跑全球,調(diào)用量大幅增長

    如今出門,如果你還沒用過AI智能助手,可能真有點(diǎn)跟不上節(jié)奏了。無論是寫作文、查資料,還是規(guī)劃出行路線,越來越多的人已經(jīng)習(xí)慣隨手打開AI問一句。這股熱潮背后,中國AI大模型用實(shí)打?qū)嵉臄?shù)據(jù)交出了一份亮眼的成績單。根據(jù)全球知名AI模型聚合平臺(tái)OpenRouter的最新數(shù)據(jù),在3月30日至4月5日這一周,中

    標(biāo)簽:
    大模型

熱門排行

編輯推薦