域名預(yù)訂/競(jìng)價(jià),好“米”不錯(cuò)過(guò)
文|雷宇
來(lái)源|智能相對(duì)論(aixdlun)
人民對(duì)性的態(tài)度向來(lái)很奇怪,父母和長(zhǎng)輩期待子女能無(wú)師自通,教育者三緘其口,最后少男少女通過(guò)其他渠道實(shí)現(xiàn)了對(duì)性的初級(jí)摸索,當(dāng)然這個(gè)摸索過(guò)程就很曲折了,文字,圖片,視頻和音頻遍地開(kāi)花,“學(xué)習(xí)資料”越來(lái)越方便傳播。
食也性也,但傳播色情內(nèi)容卻有極大的負(fù)外部效應(yīng),懵懂少男少女極易受其蠱惑,鑒黃師的重要性可想而知。在蘋(píng)果商店的社交App中,有超過(guò)1/10的應(yīng)用主打聲音社交功能,由此催生出了一個(gè)新興職業(yè)——聲音鑒黃師。聲音鑒黃師是一個(gè)讓身心飽受摧殘的職業(yè),一位女性聲音鑒黃師稱,“一個(gè)人平均一天需要鑒定4000條信息,24小時(shí)輪班監(jiān)控,各種葷段子、曖昧語(yǔ)音,有時(shí)(聽(tīng)到)惡心想吐。”
聲音鑒黃師是一份不足以為外人道也的工作
由于這份工作實(shí)在是太過(guò)于枯燥,很多男生都受不了,因此聲音鑒黃師多為女性且離職率高。一般枯燥且重復(fù)率高的工作都是AI的拿手好戲,那么AI有沒(méi)有辦法實(shí)現(xiàn)聲音鑒黃呢?
聲音鑒黃之殤,AI難以克服雞尾酒效應(yīng)
視頻,圖片和語(yǔ)音是色情內(nèi)容常見(jiàn)的三種形式,多數(shù)公司的鑒黃都是立足于視頻和圖片,比如阿里的阿里綠網(wǎng)、騰訊的萬(wàn)象優(yōu)圖等等。有人可能會(huì)疑問(wèn),這幾年科大訊飛、百度、騰訊等公司先后對(duì)外公布語(yǔ)音識(shí)別準(zhǔn)確率均達(dá)到“97%”,那為什么在AI語(yǔ)音鑒黃上那么難?
這是因?yàn)樯缃黄脚_(tái)的語(yǔ)音環(huán)境十分復(fù)雜,機(jī)器很難從龐大雜亂的語(yǔ)音中揪出涉黃涉暴人員,而這就不得不提雞尾酒效應(yīng)了。所謂雞尾酒效應(yīng)是指,在雞尾酒會(huì)嘈雜的人群中,盡管周圍噪聲很大,兩人可以順利交談,你們似乎聽(tīng)不到談話內(nèi)容以外的各種噪音。這是因?yàn)槲覀兊拇竽X對(duì)聲音都進(jìn)行了某種程度的預(yù)判,然后才決定聽(tīng)或不聽(tīng)。
用特瑞斯曼的注意衰減理論來(lái)解釋就是,當(dāng)人的聽(tīng)覺(jué)注意集中于某一事物時(shí),意識(shí)將一些無(wú)關(guān)聲音刺激排除在外,而無(wú)意識(shí)卻監(jiān)察外界的刺激,一旦一些特殊的刺激與己有關(guān),就能立即引起注意的現(xiàn)象。
但是機(jī)器卻不具備這樣意識(shí)和無(wú)意識(shí),因此難以實(shí)現(xiàn)在嘈雜環(huán)境下的語(yǔ)音識(shí)別,這樣看來(lái)AI語(yǔ)音鑒黃貌似已經(jīng)走進(jìn)了死胡同。
實(shí)際上,已有公司在解決雞尾酒效應(yīng)上做出了努力。今年4 月,Google曾在博客上發(fā)文稱,谷歌研究人員開(kāi)發(fā)出了一種深度學(xué)習(xí)系統(tǒng),可識(shí)別和分離出嘈雜環(huán)境中的個(gè)體聲音。
研究人員從YouTube上10萬(wàn)段“講座和談話”視頻中提取了近2000小時(shí)的視頻片段,然后混合音頻與人工背景噪聲,創(chuàng)造“雞尾酒派對(duì)”。訓(xùn)練技術(shù)人員將混合音頻進(jìn)行拆分,谷歌的系統(tǒng)能夠分辨出哪個(gè)音頻源在給定的時(shí)間內(nèi)屬于哪張人臉,并為每個(gè)揚(yáng)聲器創(chuàng)建單獨(dú)的語(yǔ)音軌跡。
但Google的技術(shù)集中在視頻處理上,主要是對(duì)數(shù)段聲音的分離,而人工聲音鑒黃僅僅依靠聲音,有所不同。前不久,阿里AI語(yǔ)音反垃圾服務(wù)上線公測(cè),它可以通過(guò)聲紋識(shí)別技術(shù),識(shí)別語(yǔ)音中存在的涉黃、廣告等違規(guī)信息,不管是中日英俄等語(yǔ)言,還是東北,四川,廣東的方言,甚至連無(wú)意義的呻吟聲都可以輕松判別。
具體辦法是,對(duì)那些有語(yǔ)義的內(nèi)容,系統(tǒng)先將語(yǔ)音識(shí)別轉(zhuǎn)成文字,然后再將這些文字跟文本反垃圾模型或關(guān)鍵詞庫(kù)比對(duì),判斷是否涉黃,對(duì)那些無(wú)語(yǔ)義的聲音,通過(guò)聲紋也能識(shí)別出來(lái)。但有一點(diǎn)值得注意的是,在語(yǔ)音識(shí)別的過(guò)程中,識(shí)別是哪種語(yǔ)言比內(nèi)容更難,機(jī)器翻譯也存在這樣的問(wèn)題,因此還需要大量數(shù)據(jù)來(lái)進(jìn)行訓(xùn)練學(xué)習(xí)。
做好嘈雜環(huán)境的語(yǔ)音識(shí)別,難點(diǎn)是如何將雜音與人聲分離。但對(duì)于聲音鑒黃而言,一開(kāi)始并不知道哪一個(gè)音源涉黃,很難說(shuō)誰(shuí)是噪音,這需要機(jī)器具有全局觀。而上面提到的技術(shù),聲音分離或者將語(yǔ)音識(shí)別轉(zhuǎn)成文字都只是基本,由于尚未在語(yǔ)音復(fù)雜的環(huán)境下試驗(yàn)過(guò),因此這個(gè)結(jié)果嘛……退一萬(wàn)步講,社交黑話也并不是那么好破譯的。
社交黑話難解,語(yǔ)音識(shí)別障礙重重
時(shí)代要拋棄你,它只會(huì)讓你看不懂,而我們也不能指望人工智能聽(tīng)懂。
就像你爹媽當(dāng)初看不懂你的那句簽名:”ァ亊實(shí)證明,鱤綪桱淂起fеηɡ雨,卻桱囨起平啖;伖綪桱淂起平啖,卻桱囨起fеηɡ雨。ヤ”(沒(méi)亂碼),新一代社交黑話崛起一般人也很難看懂,比如XSWL(笑死我了,相當(dāng)于一連串哈哈哈),NSS(暖說(shuō)說(shuō),指幫點(diǎn)贊評(píng)論轉(zhuǎn)發(fā)說(shuō)說(shuō),增進(jìn)感情),CQY(處Q友的縮寫(xiě),想在QQ上找朋友的意思)。
當(dāng)然這也還算好的,無(wú)非就是縮寫(xiě)。除了縮寫(xiě),還有一些只能強(qiáng)記的詞語(yǔ)。比如養(yǎng)火(互發(fā)消息三天出現(xiàn)小火花,互發(fā)消息超過(guò)三十天出現(xiàn)大火花,養(yǎng)火就是經(jīng)常聯(lián)系的意思),歐洲(想要什么就得到什么的人)……
估計(jì)研究人員在錄入數(shù)據(jù)時(shí)就陣亡了,畢竟這玩意看上去也不算有章可循。值得注意的是,當(dāng)人們?cè)谡f(shuō)話的時(shí)候,如果省略一兩個(gè)字不說(shuō),懂得的人自然也懂,但機(jī)器不一定能識(shí)別人們甚至為了混淆視聽(tīng),會(huì)多語(yǔ)夾雜,這就給機(jī)器識(shí)別增添了難度。
這種輸入標(biāo)準(zhǔn)的不統(tǒng)一,是導(dǎo)致語(yǔ)音識(shí)別錯(cuò)誤率高的首要原因。我們常用的鼠標(biāo)和鍵盤雖然看似簡(jiǎn)單,但它具備統(tǒng)一的輸入標(biāo)準(zhǔn)和精準(zhǔn)的視覺(jué)反饋這兩點(diǎn),而這正是語(yǔ)音識(shí)別技術(shù)不具備的,也是困擾現(xiàn)階段AI鑒黃的一大挑戰(zhàn)。
毫不意外,現(xiàn)階段的聲音鑒黃師依然是以人為主。早在互聯(lián)網(wǎng)發(fā)展早期,黃色內(nèi)容主要是圖片和文字,靠人工就可以凈化網(wǎng)絡(luò)環(huán)境的目的,但是隨著互聯(lián)網(wǎng)帶來(lái)的數(shù)據(jù)爆炸,人工已經(jīng)遠(yuǎn)遠(yuǎn)不能勝任。
雖然聲音鑒黃以人為本,但這并不意味著AI鑒黃師沒(méi)有價(jià)值。它能在特定的場(chǎng)景實(shí)現(xiàn)鑒定也無(wú)疑算是一種進(jìn)步,而現(xiàn)階段它所呈現(xiàn)的問(wèn)題,也無(wú)疑是技術(shù)發(fā)展過(guò)程中難以避免的陣痛。
全球經(jīng)濟(jì)學(xué)家和咨詢公司的主流研究課題,總少不了人工智能會(huì)引發(fā)的失業(yè)規(guī)模,但是中國(guó)的互聯(lián)網(wǎng)已經(jīng)跑出了一條獨(dú)特的路線,因此針對(duì)中國(guó)的研究少之又少。聲音鑒黃師作為互聯(lián)網(wǎng)發(fā)展過(guò)程中的獨(dú)特產(chǎn)物,顯然會(huì)存在相當(dāng)長(zhǎng)一段時(shí)間,而現(xiàn)行的人工智能鑒黃也多為輔助人。
一句正確但無(wú)用的話是,可以想見(jiàn)未來(lái)AI鑒黃會(huì)占據(jù)主流,但這個(gè)未來(lái)應(yīng)該以哪個(gè)時(shí)間節(jié)點(diǎn)為基準(zhǔn),誰(shuí)也無(wú)法預(yù)料。
智能相對(duì)論(微信id:aixdlun):深挖人工智能這口井,評(píng)出咸淡,講出黑白,道出vb深淺。重點(diǎn)關(guān)注領(lǐng)域:AI+醫(yī)療、機(jī)器人、智能駕駛、AI+硬件、物聯(lián)網(wǎng)、AI+金融、AI+安全、AR/VR、開(kāi)發(fā)者以及背后的芯片、算法、人機(jī)交互等。
申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!
展望科大訊飛的2022,“訊飛超腦2030計(jì)劃”發(fā)布,科大訊飛全面錨定虛擬人、虛擬寵物,在雄厚的技術(shù)能力和豐富的場(chǎng)景經(jīng)驗(yàn)支持下,持續(xù)驗(yàn)證著其面向新場(chǎng)景、新領(lǐng)域的創(chuàng)新能力,也在加速轉(zhuǎn)化成為其未來(lái)5到10年的業(yè)績(jī)支撐點(diǎn)。
如今,人們對(duì)不受空間、時(shí)間限制的智能化、科技化家庭健身服務(wù)需求日益迫切,AI智能健身已然成為大眾健身新訴求,廣東中科凱澤信息科技有限公司作為新興崛起的智能健身研發(fā)企業(yè)
1956年8月,以香農(nóng)為代表的一群科學(xué)家在達(dá)特茅斯學(xué)院,圍繞著“用機(jī)器來(lái)模仿人類學(xué)習(xí)以及其他方面的智能”這個(gè)主題,創(chuàng)造出人工智能(ArtificialIntelligence)這個(gè)影響深遠(yuǎn)的概念。
近日,人工智能學(xué)術(shù)與產(chǎn)業(yè)界的權(quán)威年度盛會(huì)“MEET2022智能未來(lái)大會(huì)”召開(kāi),會(huì)上公布年度人工智能領(lǐng)航企業(yè)、人工智能創(chuàng)業(yè)領(lǐng)袖等榜單。其中,影譜科技創(chuàng)始人姬曉晨女士入選2021年度人工智能創(chuàng)業(yè)領(lǐng)袖,成為唯一上榜的女性企業(yè)家,同時(shí)上榜的還有商湯、曠視、依圖、第四范式、地平線等企業(yè)領(lǐng)袖。
蘋(píng)果16弄了兩個(gè)版本,一個(gè)是專門給中國(guó)人用的,準(zhǔn)備用百度的AI,還要交錢。第二個(gè)是全世界都可以用的,用了ChatGPT,包括臺(tái)灣、香港、澳門都可以用。以后都這樣了。好,問(wèn)題就出在這,蘋(píng)果和百度的合作出現(xiàn)問(wèn)題了,新聞連起來(lái)看,才能明白其中含義。新聞一:蘋(píng)果正在和騰訊、字節(jié)初步接洽,考慮將二者的AI模型
“技術(shù)日新月異,人類生活方式正在快速轉(zhuǎn)變,這一切給人類歷史帶來(lái)了一系列不可思議的奇點(diǎn)。我們?cè)?jīng)熟悉的一切,都開(kāi)始變得陌生。”計(jì)算機(jī)之父約翰·馮·諾依曼曾這樣說(shuō)到。
“人工智能的商業(yè)模式,是要?jiǎng)?chuàng)造一個(gè)市場(chǎng),而非一個(gè)算法”。這是世界AI泰斗MichaelI.Jordan的觀點(diǎn)。而當(dāng)前的全球AI市場(chǎng),占據(jù)主導(dǎo)地位的中美雙方,卻也走出了兩條截然不同的技術(shù)路徑,前者執(zhí)著于前沿技術(shù)的探索,后者則發(fā)力應(yīng)用優(yōu)化和商業(yè)化落地。南轅北轍的兩個(gè)方向,或許已經(jīng)無(wú)法直接進(jìn)行排位先后、優(yōu)
智能體進(jìn)化發(fā)展了一年,現(xiàn)在的RPAAgent迭代到什么程度了?從實(shí)在智能最新發(fā)布的實(shí)在Agent7.0,看RPAAgent的迭代升級(jí)抓取豆瓣信息、自己制作PPT,這款A(yù)IAgent真的實(shí)現(xiàn)了流程全自動(dòng)化AIAgent構(gòu)建到執(zhí)行全自動(dòng)化,持續(xù)進(jìn)化RPAAgent再次降低智能體應(yīng)用門檻實(shí)在智能重磅發(fā)布實(shí)
崔大寶|節(jié)點(diǎn)財(cái)經(jīng)創(chuàng)始人進(jìn)入2024年,大模型似乎有熄火之勢(shì):資本市場(chǎng),與之關(guān)聯(lián)的概念炒不動(dòng)了,英偉達(dá)股價(jià)動(dòng)輒暴跌重挫,引發(fā)“泡沫戳破”的擔(dān)憂;消費(fèi)市場(chǎng),BATH們的推新活動(dòng)少了,產(chǎn)品更新迭代的速度慢了,民眾的關(guān)注度降了……熱鬧的大概只剩下兩場(chǎng)酣仗:自5月15日字節(jié)跳動(dòng)宣布“以厘計(jì)費(fèi)”,打響國(guó)內(nèi)大模型
文|智能相對(duì)論作者|陳泊丞好消息!你心心念念的事業(yè)單位發(fā)錄取公告了!壞消息!他們沒(méi)錄你,錄了個(gè)數(shù)字人。圖片來(lái)源網(wǎng)絡(luò)隨著數(shù)字人技術(shù)的突破,越來(lái)越多的傳統(tǒng)企業(yè)和機(jī)構(gòu)開(kāi)始用上了“數(shù)字員工”。甚至很多中國(guó)人心心念念的“鐵飯碗”,也被這些數(shù)字人給捧上了。數(shù)字人捧上了“鐵飯碗”簡(jiǎn)單翻看一下全國(guó)各地事業(yè)單位的“錄
黑芝麻智能敲鐘后,港交所門口又有一些智駕芯片企業(yè)引發(fā)關(guān)注。據(jù)悉,近日地平線已通過(guò)中國(guó)證監(jiān)會(huì)IPO備案,擬發(fā)行不超過(guò)11.5億股境外上市普通股并在香港聯(lián)合交易所上市,預(yù)計(jì)籌集約5億美元資金。從天眼查可以了解到,該公司成立于2015年,是一家乘用車高級(jí)輔助駕駛(ADAS)和高階自動(dòng)駕駛(AD)解決方案供
8月21日,萬(wàn)眾矚目的2024世界機(jī)器人大會(huì)暨博覽會(huì)在北京亦創(chuàng)國(guó)際會(huì)展中心盛大開(kāi)幕。這場(chǎng)為期5天,集“展覽”“論壇”“賽事”于一體的機(jī)器人盛會(huì),反映了當(dāng)下機(jī)器人領(lǐng)域的繁榮生態(tài)。據(jù)官方統(tǒng)計(jì)數(shù)據(jù),今年現(xiàn)場(chǎng)逛展觀眾高達(dá)25萬(wàn)人次,比去年增加25%。機(jī)器人行業(yè)有多火?看看2024世界機(jī)器人大會(huì)火爆程度便可知