當(dāng)前位置:首頁(yè) >  科技 >  IT業(yè)界 >  正文

搜狗搜索聯(lián)合中國(guó)中文信息學(xué)會(huì),共同發(fā)起“CIPS-SOGOU問答比賽”

 2017-09-05 11:13  來源: 互聯(lián)網(wǎng)   我來投稿 撤稿糾錯(cuò)

  阿里云優(yōu)惠券 先領(lǐng)券再下單

日前,由搜狗搜索聯(lián)合中國(guó)中文信息學(xué)會(huì)(CIPS)共同舉辦的“CIPS-SOGOU問答比賽”正式啟動(dòng)報(bào)名。作為國(guó)內(nèi)首檔基于大規(guī)模真實(shí)用戶問答數(shù)據(jù)集的問答評(píng)測(cè)任務(wù),此次大賽的舉辦,不僅能為參賽者提供挑戰(zhàn)及展示能力的舞臺(tái),還將促進(jìn)學(xué)術(shù)界及業(yè)界在智能問答領(lǐng)域的研究發(fā)展,推動(dòng)智能問答系統(tǒng)更加廣泛地面向公眾提供信息服務(wù)。

此次問答比賽分為事實(shí)型問答和非事實(shí)型問答兩項(xiàng)子任務(wù)。按照賽制,參賽者需要根據(jù)給定的問題設(shè)計(jì)算法,從候選篇章中抽取合適的詞語(yǔ)、短語(yǔ)或句子,作為問題的標(biāo)準(zhǔn)答案,能夠?qū)崿F(xiàn)正確、完整、簡(jiǎn)潔地回答問題。每個(gè)問題對(duì)應(yīng)給出10個(gè)候選答案篇章,每個(gè)篇章約50 - 500個(gè)漢字。

在評(píng)測(cè)指標(biāo)方面,事實(shí)型問答子任務(wù)將采用Accuracy和Precision-Recall(F1)指標(biāo)對(duì)*進(jìn)行評(píng)價(jià),其中Accuracy計(jì)算*和標(biāo)準(zhǔn)答案是否精確匹配,F(xiàn)1計(jì)算*相對(duì)標(biāo)準(zhǔn)答案的詞級(jí)重合度,以兩者平均值作為最終指標(biāo)。非事實(shí)型問答子任務(wù)采用ROUGE和BLEU指標(biāo)對(duì)*進(jìn)行綜合評(píng)價(jià)。

據(jù)悉,此次比賽的事實(shí)型問答子任務(wù),將從9月1日起開始提交報(bào)名,有興趣參賽的高校生、業(yè)內(nèi)研究人員等,可通過“搜狗實(shí)驗(yàn)室”官網(wǎng)提交報(bào)名信息。非事實(shí)型問答子任務(wù),則將在12月中旬開始接受提交報(bào)名,并陸續(xù)公布比賽數(shù)據(jù)集和Leaderboard。在2018年CIPS的學(xué)術(shù)年會(huì)上,將會(huì)對(duì)兩項(xiàng)子任務(wù)中勝出的團(tuán)隊(duì)進(jìn)行頒獎(jiǎng)。

值得一提的是,作為聯(lián)合主辦方的搜狗搜索,將向大賽提供來自搜索引擎的大規(guī)模真實(shí)用戶問答數(shù)據(jù)集。其中,6萬(wàn)個(gè)問題(事實(shí)型問題3萬(wàn)、非事實(shí)型問題3萬(wàn)),代表了最真實(shí)廣泛的網(wǎng)民信息需求;60萬(wàn)對(duì)應(yīng)問題的候選篇章,來自搜索引擎返回的若干互聯(lián)網(wǎng)頁(yè)面;而經(jīng)過對(duì)頁(yè)面進(jìn)行人工分析標(biāo)注,搜狗搜索構(gòu)建了針對(duì)問題的標(biāo)準(zhǔn)答案,最終形成大規(guī)模、極具價(jià)值的問答數(shù)據(jù)集。

據(jù)了解,目前在智能問答研究領(lǐng)域,可用的大規(guī)模公開數(shù)據(jù)集,尤其是反映真實(shí)用戶問答需求的中文數(shù)據(jù)集非常稀缺。業(yè)界和學(xué)術(shù)界受限于技術(shù)、數(shù)據(jù)等因素,當(dāng)前的研究主要針對(duì)“事實(shí)型問答”領(lǐng)域,而在與用戶搜索場(chǎng)景息息相關(guān)的“開放域智能問答”領(lǐng)域則一直無(wú)法取得突破性進(jìn)展。搜狗搜索此次公開的大規(guī)模數(shù)據(jù)集,不僅能促進(jìn)“CIPS-SOGOU問答比賽”的正常開展,還能將給整個(gè)智能問答行業(yè)的研究發(fā)展提供寶貴的數(shù)據(jù)支撐,從而推動(dòng)智能問答系統(tǒng)更加廣泛地面向公眾提供信息服務(wù)。

事實(shí)上,憑借在人工智能領(lǐng)域的持續(xù)投入及搜索引擎的數(shù)據(jù)優(yōu)勢(shì),搜狗搜索目前在智能問答領(lǐng)域已處于行業(yè)領(lǐng)先地位。搜狗搜索此前已上線的“立知”智能問答系統(tǒng),就是搜狗研發(fā)的面向未來的搜索技術(shù)。該系統(tǒng)能夠理解用戶搜索意圖和問題,直接為用戶提供想要的答案。目前“立知”智能問答系統(tǒng)不僅能精準(zhǔn)回答事實(shí)性問題,在分析類問題、觀點(diǎn)類問題、數(shù)字類問題、隱式問題等方面,都能直接返回精確答案,背后應(yīng)用了語(yǔ)義分析、問題理解、信息抽取、知識(shí)圖譜、信息檢索、深度學(xué)習(xí)等眾多人工智能技術(shù)。

作為智能問答領(lǐng)域的引領(lǐng)者,搜狗搜索在切實(shí)推進(jìn)產(chǎn)品落地、為用戶帶來優(yōu)質(zhì)搜索體驗(yàn)的同時(shí),也注重向行業(yè)開放問答能力,不斷推動(dòng)業(yè)界及學(xué)術(shù)界的研究發(fā)展。今年4月份,搜狗搜索曾聯(lián)合CCIR 2017(2017全國(guó)信息檢索學(xué)術(shù)會(huì)議)成功舉辦了國(guó)內(nèi)首次大規(guī)模真實(shí)用戶問答數(shù)據(jù)集上的問答評(píng)測(cè)任務(wù)——首屆“面向智能問答的篇章排序”評(píng)測(cè)比賽,并公開了來自用戶真實(shí)搜索需求的5萬(wàn)個(gè)問題以及從搜狗搜索全網(wǎng)檢索結(jié)果提供的50萬(wàn)條候選篇章,極大促進(jìn)了智能問答技術(shù)的發(fā)展和應(yīng)用。

相比“面向智能問答的篇章排序”評(píng)測(cè)比賽,此次“CIPS-SOGOU問答比賽”的賽制、公開數(shù)據(jù)集等都將進(jìn)行全新升級(jí),將會(huì)在更大程度上促進(jìn)智能問答領(lǐng)域的學(xué)術(shù)交流和研究水平。對(duì)此次問答評(píng)測(cè)比賽感興趣的高校生或業(yè)內(nèi)從業(yè)者,均可報(bào)名參加。

報(bào)名鏈接:

申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)標(biāo)簽
搜狗問答

相關(guān)文章

  • 搜狗智能問答賦能華為首款智能音箱 助其化身便捷個(gè)人助理

    10月26日,華為Mate20系列中國(guó)發(fā)布會(huì)在上海東方體育中心隆重舉行。此次發(fā)布會(huì)上,除Mate20系列手機(jī)在國(guó)內(nèi)首次亮相外,華為品牌的首款智能音箱-華為AI音箱也正式對(duì)外發(fā)布。

  • 搜狗搜索“CIPS-SOGOU問答比賽”賽程加碼 正式啟動(dòng)“非事實(shí)類問答子任務(wù)”

    構(gòu)建開放域智能問答系統(tǒng)是人工智能研究領(lǐng)域的一項(xiàng)重要前沿課題。近日,由搜狗搜索聯(lián)合中國(guó)中文信息學(xué)會(huì)共同舉辦的“CIPS-SOGOU問答比賽”,正式啟動(dòng)了“非事實(shí)類問答子任務(wù)”。

    標(biāo)簽:
    搜狗搜索
    搜狗問答
  • 搜狗AI問答進(jìn)化 《一站到底》終極BOSS變身全民答題神助手

    如今的互聯(lián)網(wǎng)世界,像一部充滿了荒誕與吊詭的懸疑劇,你永遠(yuǎn)猜不到明天會(huì)發(fā)生什么。1月3日,王思聰在微博上宣布將在沖頂大會(huì)APP上“撒幣”,當(dāng)時(shí)這條微博下的評(píng)論大部分還是關(guān)于李小璐的出軌緋聞。隨后,花椒、西瓜、映客等平臺(tái)卷入其中,正式掀起全民答題熱潮。1月11日,大四女生小容在花椒“百萬(wàn)贏家”上力克百萬(wàn)

    標(biāo)簽:
    搜狗問答
  • 各大撒幣平臺(tái)都傻眼 搜狗智能問答有了最接地氣的應(yīng)用

    互聯(lián)網(wǎng)界從來不缺戲劇性。2017年被看走衰的直播行業(yè),2018年年初因?yàn)橹辈ゴ痤}再度火了起來。先是王思聰投資的沖頂大會(huì)高調(diào)上線,一石激起千層浪,之后,西瓜視頻的百萬(wàn)英雄、映客的芝士超人等答題平臺(tái)紛紛進(jìn)場(chǎng),獎(jiǎng)金額度一個(gè)比一個(gè)高,從十幾萬(wàn)到上百萬(wàn),不斷刺激著網(wǎng)友們的腎上腺。就在眾多直播平臺(tái)忙著制造“撒幣

    標(biāo)簽:
    搜狗問答
  • 艾媒咨詢:搜狗搜索穩(wěn)居行業(yè)第二 AI戰(zhàn)略重點(diǎn)發(fā)力問答、翻譯領(lǐng)域

    移動(dòng)搜索已成為當(dāng)下最主要的搜索方式。艾媒咨詢?nèi)涨鞍l(fā)布《2017Q3中國(guó)移動(dòng)搜索市場(chǎng)研究報(bào)告》指出,目前移動(dòng)搜索用戶規(guī)模已趨向飽和狀態(tài),增長(zhǎng)速度放緩且較為穩(wěn)定。今年第三季度中國(guó)移動(dòng)搜索市場(chǎng)用戶首選搜索品牌使用分布中,搜狗搜索以22.3%的占比繼續(xù)穩(wěn)居行業(yè)第二。艾媒咨詢預(yù)測(cè),作為人工智能帶路黨,搜狗憑借

    標(biāo)簽:
    搜狗問答

熱門排行

信息推薦