前段時間, 一款主打即時性的音頻社交軟件火了。
音頻社交春天將至?
作為一款以語音為媒介的社交軟件,它的玩法非常簡單。在每個房間有主持人、嘉賓、觀眾三種角色。主持人創(chuàng)建房間后,跟嘉賓聊天,觀眾可旁聽,三種身份經(jīng)主持人同意后還可轉(zhuǎn)換,主播也可邀請觀眾上麥互動。他們以語音的形式進行交流,聽后即焚。這便是典型的實時語音語聊房場景。
那么它的創(chuàng)新點在哪?
1、內(nèi)容與玩法的創(chuàng)新:KOL 紅人 VS. 意見領(lǐng)袖
2、KOL 紅人:草根文化的發(fā)展,KOL 紅人與普通人相同的生活方式,被更多用戶所消費
3、意見領(lǐng)袖:通過自己多年的積累和影響力,在某一行業(yè)完成行業(yè)的帶貨,是行業(yè)中的明星,自帶光環(huán),受大家追捧
基于內(nèi)容、玩法、亞文化圈層創(chuàng)新的音頻社交賽道,隨著 5G 時代對于音頻質(zhì)量的改善或?qū)⒄嬲瓉硇袠I(yè)爆發(fā)的春天,相較文字,語音信息量更大且更具個性化,包含的情緒和信息更豐富,可預(yù)見將會創(chuàng)造更多的社交玩法與場景。但快速爆發(fā)的實時音視頻需求仍然面臨挑戰(zhàn),一套成熟的音視頻技術(shù)體系成為助力產(chǎn)品快速發(fā)展的必要保證,與此同時,音頻社交的場景催生了新的合規(guī)需求,如何保證平臺音頻內(nèi)容合規(guī)成為產(chǎn)品穩(wěn)健發(fā)展的剛需。
一套成熟的技術(shù)體系是怎樣的?
一套音頻社交的搭建并不復(fù)雜,原有看起來十分高深的音視頻與實時互動的技術(shù),已經(jīng)變得易于接入。
這套看似復(fù)雜的音頻社交邏輯,這里做一下技術(shù)程度的拆解。
如同我們針對復(fù)雜問題的處理,都會先進行分塊處理一樣,音頻社交的技術(shù)架構(gòu)在業(yè)務(wù)角度也可拆解為:意見領(lǐng)袖的語音交互、意見領(lǐng)袖的語音處理和粉絲的音頻獲取三個部分來看:
1、意見領(lǐng)袖的語音交互
在七牛云 QRTC 的實時連麥產(chǎn)品加持下,通過易用的房間創(chuàng)建邏輯建立意見領(lǐng)袖的話題房間,在其他意見領(lǐng)袖的房間加入后,意見領(lǐng)袖們通過線上的連麥房間進行實時的語音互動,并且針對預(yù)設(shè)話題進行溝通交流。
七牛云的 QRTC 在開源的 WebRTC 之上,經(jīng)過自有研發(fā)能力和眾多客戶的驗證,保障了意見領(lǐng)袖們雖身處多地,甚至分別處于不同的國家,亦可保障通信的實時,交互延遲僅在 150ms 左右,讓意見領(lǐng)袖雖無法見面,但猶如面對面交流般順暢。
2、意見領(lǐng)袖的語音處理
意見領(lǐng)袖的語音交流內(nèi)容經(jīng)過云端的優(yōu)化處理和信息審查之后,將流暢的對話語音通過成熟直播分發(fā)網(wǎng)絡(luò)對外進行分發(fā)。
在這樣云端處理的過程中,既保障了意見領(lǐng)袖們交流信息的完整,亦可完成對信息的內(nèi)容篩查和優(yōu)化。
3、粉絲的音頻獲取
在七牛云的直播功能承載下,意見領(lǐng)袖們的交流信息,通過語音的形式,呈現(xiàn)在粉絲們的耳邊。讓意見領(lǐng)袖們的粉絲,如同身處房間內(nèi)聽取自己偶像們的聲音。
同時,客戶端上多年的技術(shù)積累,讓聽眾雖身處不同網(wǎng)絡(luò)環(huán)境,都可以以最優(yōu)的用戶體驗來獲取意見領(lǐng)袖們的對話語音。
那么,從接入角度看,語聊房的接入又是怎樣的呢?
1、意見領(lǐng)袖端的研發(fā)接入:
這里為研發(fā)人員提供 Android、iOS、Web 和小程序等不同系統(tǒng)依賴 SDK 內(nèi)容,在完成 SDK 引入后,通過以下 5 個步驟的補全實現(xiàn),即可完成意見領(lǐng)袖端的研發(fā)接入:
完成音視頻核心初始化:用于初始化 SDK 中七牛音視頻互動的核心能力;
進房:建立房間,并實現(xiàn)意見領(lǐng)袖的上麥。為保障意見領(lǐng)袖彼此的通話質(zhì)量,目前支持14 位意見領(lǐng)袖的同時交流;
發(fā)布語音 track:監(jiān)聽并收集意見領(lǐng)袖的語音信息,建立與其他意見領(lǐng)袖的通話;
退房:實現(xiàn)意見領(lǐng)袖的退出房間后的多方感知;
銷毀:實現(xiàn)整體流程結(jié)束后的資源回收。
2、服務(wù)端的業(yè)務(wù)邏輯處理:
在意見領(lǐng)袖端完成房間的創(chuàng)建和進房等操作后,服務(wù)端通過以下 3 個步驟的處理,實現(xiàn)多位意見領(lǐng)袖通話內(nèi)容的直播轉(zhuǎn)推邏輯:
接入服務(wù)端 SDK,完成鑒權(quán)邏輯的支持;
完成回調(diào)邏輯的支持,用于處理不同房間事件通知的處理;
建立合流轉(zhuǎn)推任務(wù),用戶意見領(lǐng)袖交流內(nèi)容,被更多的粉絲收聽。
3、粉絲端的收聽接入:
粉絲端七牛云也提供了 Android、iOS 等不同版本的播放器 SDK 的支持,在 SDK 的依賴引入后,通過支持播放器初始化、并且將獲取到的直播地址賦值給到播放器的播放鏈接,就可以完成不同系統(tǒng)的粉絲收聽支持。
監(jiān)管之下的內(nèi)容審核
隨著國內(nèi)政策對網(wǎng)絡(luò)平臺言論管理的規(guī)范化,社交平臺面臨的內(nèi)容審核也越來越嚴。相比傳統(tǒng)的音頻內(nèi)容審核,在語聊房場景中的多人實時語音的在線審核,非常繁雜,尤其是日活較高的社交產(chǎn)品,語音內(nèi)容審核成本和難度更大。因為語音審核除了基礎(chǔ)的文本分類技術(shù)外,還有三大基礎(chǔ)技術(shù)難題,即:
語音識別:互聯(lián)網(wǎng)語音場景常伴有強背景音、語速快、咬字不清、口音嚴重等情況,相比普通場景,語音識別難度倍增;
NLP:涉政、色情、辱罵等違規(guī)音頻表達變化多端、內(nèi)容隱晦,對語義理解的要求極高;
聲紋識別:*、嬌喘等色情內(nèi)容容易混雜在對話、歌聲甚至背景音當中,聲紋特征細微,難鑒別,需要極強的聲紋識別能力。
七牛云針對實時音頻流的內(nèi)容審核場景提供色情/廣告/涉政/違規(guī)等內(nèi)容的識別,及嬌喘類聲音的識別能力。并且提供兩種方式接入,幫助客戶提高審核效率,凈化網(wǎng)絡(luò)環(huán)境:
直播審核 API - 適用于直播場景。實時監(jiān)測,3 秒內(nèi)返回結(jié)果;
文件審核 API - 適用于語音消息、文件、短視頻??梢宰龅较葘徍蟀l(fā)。
音頻社交的快速發(fā)展得益于語音與文字等傳統(tǒng)社交介質(zhì)的不同優(yōu)勢,對于情緒恰到好處的傳達,七牛云作為國內(nèi)領(lǐng)先一站式云平臺即服務(wù)(PaaS)提供商,為此類產(chǎn)品提供一整套成熟的音頻技術(shù)體系與合規(guī)技術(shù)解決方案,有效助力客戶專注業(yè)務(wù)創(chuàng)新獲得快速增長。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!