近日,智言科技AI團(tuán)隊(duì)刷新CommonsenseQA數(shù)據(jù)集世界排名,以超出第二名3個(gè)百分點(diǎn)的成績(jī)位列榜單第一。該榜單參與團(tuán)隊(duì)包括微軟亞洲研究院、阿里達(dá)摩院、FacebookAI、CMU等。以常識(shí)性問(wèn)答為應(yīng)用是 NLP 最重要的前進(jìn)方向之一,其目的是幫助計(jì)算機(jī)通過(guò)已有的知識(shí)來(lái)推理判斷未見(jiàn)過(guò)的輸入信息,從而使計(jì)算機(jī)更理解人的意思。
CommonsenseQA任務(wù)由以色列特拉維夫大學(xué)建立,是一個(gè)新的多項(xiàng)選擇題答案數(shù)據(jù)集,它需要不同類型的常識(shí)知識(shí)來(lái)預(yù)測(cè)正確的答案,是極具有挑戰(zhàn)性的數(shù)據(jù)集。數(shù)據(jù)集中的12102個(gè)問(wèn)題,包含一個(gè)正確答案和四個(gè)干擾因素答案,測(cè)試結(jié)果每?jī)芍茉u(píng)估一次。目前排名第一的智言科技團(tuán)隊(duì)獲得76.5%的準(zhǔn)確性,在排名中超越第二名3個(gè)百分點(diǎn),在NLP領(lǐng)域中已是很大的進(jìn)步和超越,但是仍低于人類88.9%的水平,可見(jiàn)NLP在常識(shí)性推理方向仍有很大挑戰(zhàn)和進(jìn)步空間。

CommonsenseQA LeaderBoard,智言科技目前排名第一
當(dāng)人類回答問(wèn)題時(shí),他們會(huì)依據(jù)常識(shí)、背景知識(shí)、空間關(guān)系、原因、結(jié)果、科學(xué)事實(shí)和社會(huì)慣例等,來(lái)判斷問(wèn)題答案。例如,提出了一個(gè)問(wèn)題:“當(dāng)李蒙聽(tīng)到割草機(jī)的聲音時(shí),他在哪里?”可以推斷割草機(jī)靠近李蒙時(shí),同時(shí)可能在戶外并位于街道上。這種知識(shí)對(duì)人類而言似乎微不足道,但是仍然超出了當(dāng)前的自然語(yǔ)言理解(NLU)系統(tǒng)。
當(dāng)前閱讀理解模型主要所關(guān)注的問(wèn)題類型是事實(shí)類問(wèn)題(factoid questions),這類型的問(wèn)題答案往往能直接在原文中找到,然而如何基于常識(shí)和背景知識(shí)進(jìn)行推理以獲得答案仍舊是一個(gè)巨大的挑戰(zhàn)。數(shù)據(jù)集 CommonsenseQA、CosmosQA 等相繼被提出便是為了促進(jìn)該方向的發(fā)展。在這些數(shù)據(jù)集中,機(jī)器需要結(jié)合常識(shí)知識(shí)來(lái)回答諸如“我可以站在河上的什么地方看水流而不會(huì)弄濕自己?”這樣的問(wèn)題,因此更具挑戰(zhàn)性。
如果想人工智能要更好地服務(wù)于人類、更多地介入人類的日常生活,人工智能機(jī)器人就需要理解人類自然語(yǔ)言的意義,提前學(xué)習(xí)、掌握常識(shí)并據(jù)此進(jìn)行推理。大家已經(jīng)充分地認(rèn)識(shí)到:人工智能的下一步發(fā)展和實(shí)用化,必須突破語(yǔ)義理解和常識(shí)推理這一瓶頸。我們認(rèn)為語(yǔ)義理解和常識(shí)推理研究的進(jìn)展,依賴于全新的自然語(yǔ)言處理技術(shù)和理念。
在商業(yè)化應(yīng)用當(dāng)中,人工智能帶來(lái)的首先應(yīng)該是商業(yè)模式上的轉(zhuǎn)變,然后是運(yùn)用的效率轉(zhuǎn)變。智言科技的AI團(tuán)隊(duì)始終專注于自然語(yǔ)言處理領(lǐng)域的技術(shù)突破,同時(shí)將知識(shí)圖譜融入其中,幫助傳統(tǒng)企業(yè)進(jìn)行數(shù)字化轉(zhuǎn)型。基于多個(gè)垂直行業(yè)的大量對(duì)話應(yīng)用場(chǎng)景,智言科技在自然語(yǔ)言理解、意圖識(shí)別及邏輯推理等技術(shù)上取得了較好的效果。
對(duì)于企業(yè)員工來(lái)說(shuō),客戶所提出的問(wèn)題相似度很高,使得工作重復(fù)繁瑣,這部分工作已經(jīng)實(shí)現(xiàn)人工智能技術(shù)的部分替代性,有效提高工作效率,降低企業(yè)運(yùn)營(yíng)成本。除此之外,在常規(guī)問(wèn)答中,為了提高機(jī)器人的問(wèn)答能力邊界,以知識(shí)圖譜形式應(yīng)用的非結(jié)構(gòu)化數(shù)據(jù)、對(duì)話的數(shù)據(jù)不斷累積,從而優(yōu)化語(yǔ)料庫(kù)、提高準(zhǔn)確率。這些數(shù)據(jù)也是企業(yè)未來(lái)數(shù)字化轉(zhuǎn)型的新燃料。
目前市面上大部分的商業(yè)落地項(xiàng)目主要采用深度學(xué)習(xí)的技術(shù)提高模型的識(shí)別率以及對(duì)話準(zhǔn)確度,這樣的方式需要大量的數(shù)據(jù)。到了一個(gè)階段之后,即使加大數(shù)據(jù)量也無(wú)法提高模型的準(zhǔn)確率,且過(guò)程無(wú)法解釋,開(kāi)放領(lǐng)域的多輪對(duì)話目前還處在弱人工智能的階段。智言科技的知識(shí)圖譜+深度學(xué)習(xí)的優(yōu)勢(shì)是數(shù)據(jù)量小、過(guò)程可以解釋、準(zhǔn)確度高,將兩項(xiàng)結(jié)合為強(qiáng)人工智能奠定基礎(chǔ)。例如,智言科技在金融領(lǐng)域,已經(jīng)構(gòu)建了數(shù)十萬(wàn)份非結(jié)構(gòu)化文檔的知識(shí)圖譜,成為支撐落地應(yīng)用中的數(shù)據(jù)源動(dòng)力。同時(shí),為了更好的完成企業(yè)智能化應(yīng)用的閉環(huán),智言科技AI團(tuán)隊(duì)在圖像識(shí)別、語(yǔ)音識(shí)別、語(yǔ)音合成等領(lǐng)域都在不斷探索,從而為用戶帶來(lái)更好的智能化體驗(yàn)。

智言科技構(gòu)建非結(jié)構(gòu)化文檔形成為知識(shí)圖譜
人工智能勢(shì)必將對(duì)人們的工作產(chǎn)生深刻影響,因此建立新的內(nèi)部業(yè)務(wù)模式流程變得前所未有的緊迫。一些領(lǐng)先的企業(yè)認(rèn)識(shí)到,人工智能將對(duì)業(yè)務(wù)模式、員工結(jié)果及客戶和員工期望獲得的體驗(yàn)產(chǎn)生重大影響。智言科技AI團(tuán)隊(duì)對(duì)于自然語(yǔ)言處理技術(shù)以及知識(shí)圖譜技術(shù)在不斷地探索和研發(fā)。智言科技也希望通過(guò)搜索、推薦、語(yǔ)音及語(yǔ)義識(shí)別等人工智能算法,能夠滿足業(yè)務(wù)量快速增長(zhǎng)的目標(biāo),助力企業(yè)完成在新的業(yè)務(wù)模式和傳統(tǒng)系統(tǒng)之間的平穩(wěn)過(guò)渡。
申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!
2025年10月25日,2025世界青年科學(xué)家峰會(huì)之人工智能(AI)融合創(chuàng)新發(fā)展論壇在浙江溫州成功舉辦。本次論壇由國(guó)際院士科創(chuàng)中心主辦,中國(guó)投資協(xié)會(huì)能源投資專業(yè)委員會(huì)、溫港院士科創(chuàng)中心承辦,中國(guó)電工技術(shù)學(xué)會(huì)、中科先進(jìn)技術(shù)溫州研究院與溫州市電力工程學(xué)會(huì)提供支持,以“甌江論道-AI賦能綠色發(fā)展”為主題,
個(gè)人創(chuàng)業(yè)需要啟動(dòng)成本低、無(wú)需龐大團(tuán)隊(duì)、可快速驗(yàn)證、能利用個(gè)人技能或資源。這里分享適合個(gè)人創(chuàng)業(yè)的十個(gè)機(jī)會(huì)一.AI內(nèi)容優(yōu)化與本地化服務(wù)·做什么:幫助企業(yè)或個(gè)人利用AI工具(如GPT-4,Midjourney)優(yōu)化內(nèi)容生產(chǎn)流程。例如,為跨境電商撰寫(xiě)多語(yǔ)言產(chǎn)品描述,為小紅書(shū)博主生成爆款文案,為小公司制作營(yíng)銷
文/道哥美國(guó)設(shè)計(jì)軟件公司Figma近期在紐約證券交易所掛牌上市,首日即上演“狂飆”行情——發(fā)行價(jià)定每股33美元,開(kāi)盤(pán)報(bào)價(jià)85美元,較發(fā)行價(jià)翻倍。首日收?qǐng)?bào)115.50美元,較發(fā)行價(jià)大漲約250%,市值飆升至近670億美元,創(chuàng)下近30年來(lái)同等規(guī)模美股IPO的最大單日漲幅紀(jì)錄。然而,隨著短線資金獲利了結(jié),
文/一燈來(lái)源/節(jié)點(diǎn)財(cái)經(jīng)在當(dāng)前無(wú)人敢缺席的AI軍備競(jìng)賽中,巨頭們一面為巨額的資本支出焦慮,一面又向市場(chǎng)勾勒著未來(lái)的宏偉藍(lán)圖。在各家動(dòng)輒千億級(jí)投入的背景下,市場(chǎng)迫切需要一份關(guān)于AI回報(bào)價(jià)值的有力證明。而騰訊,率先給出了答卷。8月13日,騰訊控股發(fā)布2025年第二季度財(cái)報(bào)。盡管資本開(kāi)支同比劇增119%,達(dá)
文/二風(fēng)來(lái)源/節(jié)點(diǎn)財(cái)經(jīng)2025年的硅谷,一場(chǎng)沒(méi)有硝煙的戰(zhàn)爭(zhēng)正以前所未有的烈度上演。這場(chǎng)戰(zhàn)爭(zhēng)的核心武器不是代碼或芯片,而是人——那些全球僅有數(shù)千名、能夠構(gòu)建未來(lái)人工智能基礎(chǔ)模型的頂尖大腦。在這場(chǎng)激烈的人才爭(zhēng)奪戰(zhàn)中,Meta及其首席執(zhí)行官馬克·扎克伯格(MarkZuckerberg)正扮演著最具侵略性的
“養(yǎng)龍蝦”到底要花多少錢?這個(gè)問(wèn)題可能是大家最關(guān)心的。我們把成本拆成三部分:服務(wù)器租用費(fèi)+大模型API調(diào)用費(fèi)+雜項(xiàng)開(kāi)銷。第一部分:服務(wù)器租用費(fèi)。最省錢的方案當(dāng)然是本地舊電腦自托管——零新增成本,電費(fèi)忽略不計(jì)。但如前所述,你需要接受“不是7×24小時(shí)在線”的局限性。如果選擇云服務(wù)器,成本差異就很大了。
不少朋友第一次接觸OpenClaw時(shí),都會(huì)有一個(gè)相同的困惑:這玩意兒到底該裝在哪里?OpenClaw(社區(qū)戲稱“養(yǎng)龍蝦”,因Logo為龍蝦鉗)不是普通的聊天機(jī)器人,而是一款本地優(yōu)先、可自主執(zhí)行、支持多Agent分工協(xié)作的AI執(zhí)行網(wǎng)關(guān)。說(shuō)白了,它讓大模型從“只會(huì)說(shuō)話”變成“會(huì)動(dòng)手做事”——幫你管理文件
01別相信“一鍵養(yǎng)蝦,躺平賺錢”的鬼話打開(kāi)社交媒體,你可能會(huì)看到這樣的標(biāo)題:“養(yǎng)只龍蝦自動(dòng)炒股,零代碼養(yǎng)出數(shù)字巴菲特!”信了,你就輸了。真實(shí)情況是:一個(gè)做跨境電商的小哥花了200元租服務(wù)器、訂閱API,指望龍蝦幫他炒股暴富。結(jié)果龍蝦開(kāi)始幾天還像模像樣,后來(lái)直接擺爛,生成個(gè)干癟的大綱就敷衍了事。AI是
一張證書(shū)引發(fā)的討論4月7日,北京嫣然天使兒童醫(yī)院給陳光標(biāo)發(fā)了一張感謝證書(shū),感謝他捐贈(zèng)1000萬(wàn)元。這事說(shuō)起來(lái)挺曲折的。此前陳光標(biāo)高調(diào)說(shuō)要贈(zèng)給張雪一臺(tái)價(jià)值1300萬(wàn)元的勞斯萊斯,張雪回應(yīng)“收了,八折賣掉捐給嫣然”,一番拉扯之后,陳光標(biāo)把車變現(xiàn),1000萬(wàn)元直接打到了嫣然醫(yī)院賬上。醫(yī)院發(fā)證書(shū)感謝,本來(lái)是
2026年4月7日,國(guó)家安全部就AI核心術(shù)語(yǔ)“詞元”(Token)發(fā)布安全警示,強(qiáng)調(diào)在日均調(diào)用量突破140萬(wàn)億規(guī)模的市場(chǎng)背景下,需高度警惕由此引發(fā)的數(shù)據(jù)泄露與金融詐騙風(fēng)險(xiǎn)。據(jù)統(tǒng)計(jì),截至今年3月,我國(guó)日均詞元調(diào)用量已超過(guò)140萬(wàn)億,較2024年初增長(zhǎng)1000多倍。詞元作為大模型處理信息的最小單元,兼具
如今出門(mén),如果你還沒(méi)用過(guò)AI智能助手,可能真有點(diǎn)跟不上節(jié)奏了。無(wú)論是寫(xiě)作文、查資料,還是規(guī)劃出行路線,越來(lái)越多的人已經(jīng)習(xí)慣隨手打開(kāi)AI問(wèn)一句。這股熱潮背后,中國(guó)AI大模型用實(shí)打?qū)嵉臄?shù)據(jù)交出了一份亮眼的成績(jī)單。根據(jù)全球知名AI模型聚合平臺(tái)OpenRouter的最新數(shù)據(jù),在3月30日至4月5日這一周,中
01別在主電腦上養(yǎng)!這是最最重要的一條“保命”建議。很多小白心血來(lái)潮,直接在自己存著畢業(yè)論文、工作文件、銀行卡信息的主力電腦上部署OpenClaw。然后悲劇發(fā)生了:讓龍蝦幫忙整理一下桌面文件,結(jié)果它把整臺(tái)電腦的文件全刪了。這不是段子,是真事。OpenClaw一旦被授予高權(quán)限,就能執(zhí)行刪除、修改等不可
01免費(fèi)領(lǐng)養(yǎng),但飼料要錢很多人第一次聽(tīng)說(shuō)OpenClaw時(shí),腦子里冒出的第一個(gè)念頭是:開(kāi)源軟件,那不免費(fèi)嗎?沒(méi)錯(cuò),OpenClaw本身確實(shí)是開(kāi)源的,下載安裝一分錢不收。但你很快就會(huì)發(fā)現(xiàn),真正的開(kāi)銷根本不在這里。養(yǎng)一只“龍蝦”,就像領(lǐng)養(yǎng)了一只寵物——領(lǐng)養(yǎng)免費(fèi),但“蝦缸”“蝦糧”“蝦保姆”都得自己掏錢。
一只“龍蝦”,火遍全網(wǎng)“今天你養(yǎng)龍蝦了嗎?”這句話在2026年初,迅速取代“吃了嗎”成為社交媒體上的新晉暗號(hào)。別誤會(huì),這不是什么水產(chǎn)養(yǎng)殖新風(fēng)口。這里說(shuō)的“龍蝦”,是一款名為OpenClaw的開(kāi)源AI智能體。因?yàn)樗膱D標(biāo)是一只紅色龍蝦,網(wǎng)友們便把部署、配置和使用它的過(guò)程,戲稱為“養(yǎng)龍蝦”。一個(gè)開(kāi)源軟件
凌晨?jī)牲c(diǎn),小王合上筆記本,揉了揉酸脹的眼睛?;艘粋€(gè)月寫(xiě)出來(lái)的10萬(wàn)字短劇劇本躺在硬盤(pán)里,要真正把它拍成劇,得找演員、租場(chǎng)地、請(qǐng)攝像、做后期……粗算下來(lái)少說(shuō)要幾十萬(wàn),他只能把劇本繼續(xù)鎖在抽屜里。不過(guò),現(xiàn)在小王的劇本可以“見(jiàn)光”了。2026年3月19日,字節(jié)跳動(dòng)旗下的小云雀AI正式上線了短劇Agent