9月24日,2025云棲大會(huì)開(kāi)幕,阿里通義旗艦?zāi)P蚎wen3-Max重磅亮相,性能超過(guò)GPT5、Claude Opus 4等,躋身全球前三。Qwen3-Max包括指令(Instruct)和推理(Thinking)兩大版本,其預(yù)覽版已在 Chatbot Arena 排行榜上位列第三,正式版性可望再度實(shí)現(xiàn)突破。
Qwen3-Max為通義千問(wèn)家族中最大、最強(qiáng)的基礎(chǔ)模型。該模型預(yù)訓(xùn)練數(shù)據(jù)量達(dá)36T tokens,總參數(shù)超過(guò)萬(wàn)億,擁有極強(qiáng)的Coding編程能力和Agent工具調(diào)用能力。在大模型用Coding解決真實(shí)世界問(wèn)題的SWE-Bench Verified測(cè)試中,Instruct版本斬獲69.6分,位列全球第一梯隊(duì);在聚焦Agent工具調(diào)用能力的Tau2-Bench測(cè)試中,Qwen3-Max取得突破性的74.8分,超過(guò)Claude Opus4和DeepSeek-V3.1。

【圖說(shuō)】:Qwen3-Max-Instrurct測(cè)評(píng)分?jǐn)?shù)
Qwen3-Max的推理增強(qiáng)版本Qwen3-Max-Thinking-Heavy也展現(xiàn)出非凡性能,結(jié)合工具調(diào)用和并行推理技術(shù),其推理能力創(chuàng)下新高,尤其在聚焦數(shù)學(xué)推理的AIME 25和HMMT測(cè)試中,均達(dá)到突破性的滿(mǎn)分100分,為國(guó)內(nèi)首次。Qwen3-Max推理模型之所以能夠取得優(yōu)異成績(jī),原因在于大模型在解數(shù)學(xué)題時(shí)懂得調(diào)動(dòng)工具,能夠?qū)懘a做題,同時(shí),增加測(cè)試時(shí)的計(jì)算資源,也讓模型表現(xiàn)變得更好。

【圖說(shuō)】:Qwen3-Max-Thinking-Heavy 測(cè)評(píng)分?jǐn)?shù)
大模型預(yù)訓(xùn)練原理Scaling Law(規(guī)?;▌t)認(rèn)為,持續(xù)地增長(zhǎng)數(shù)據(jù)和參數(shù)規(guī)模,是通向 AGI 的可能路徑之一。由于自然數(shù)據(jù)的數(shù)量有限,當(dāng)前有部分學(xué)者認(rèn)為預(yù)訓(xùn)練的Scaling Law即將逼近上限,而Qwen3-Max的性能突破顯示,繼續(xù)增大數(shù)據(jù)、模型參數(shù),依然能鍛造出更強(qiáng)的模型,給予了大家更多的信心。目前,通義千問(wèn)系列模型已經(jīng)實(shí)現(xiàn)從0.5B到超萬(wàn)億的全尺寸覆蓋,包含三百多個(gè)大模型,可滿(mǎn)足不同場(chǎng)景的需求。
即日起,用戶(hù)可在通義千問(wèn)QwenChat上免費(fèi)體驗(yàn)Qwen3-Max,也可通過(guò)阿里云百煉平臺(tái)調(diào)用API服務(wù)。
申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!
4月2日,字節(jié)跳動(dòng)旗下火山引擎在武漢舉行的AI創(chuàng)新巡展上宣布,Seedance2.0API正式面向企業(yè)用戶(hù)開(kāi)啟公測(cè)。同時(shí),火山引擎總裁譚待在會(huì)上披露,截至今年3月,豆包大模型日均Token使用量已突破120萬(wàn)億,在過(guò)去三個(gè)月內(nèi)增長(zhǎng)一倍,比2024年5月發(fā)布時(shí)增長(zhǎng)1000倍。Seedance2.0:從
養(yǎng)AI小龍蝦的路上,坑不少。有人被代裝服務(wù)騙了錢(qián),有人電腦中了毒,有人收到天價(jià)賬單,還有人發(fā)現(xiàn)AI“失控”了,開(kāi)始亂刪文件。如果你也遇到這些糟心事,別慌。下面這份“養(yǎng)蝦應(yīng)急包”,告訴你第一時(shí)間該做什么。場(chǎng)景一:代裝被騙,錢(qián)打水漂了花了300塊找人遠(yuǎn)程裝OpenClaw,結(jié)果對(duì)方收了錢(qián)就拉黑,或者裝了
把AI智能體請(qǐng)進(jìn)電腦,就像把家里所有的鑰匙交給了一個(gè)陌生人。它能幫你打掃房間、整理文件,但萬(wàn)一它“起了壞心”,或者被壞人利用了,你的家就不再安全了。這不是危言聳聽(tīng)。國(guó)家互聯(lián)網(wǎng)應(yīng)急中心已經(jīng)發(fā)布風(fēng)險(xiǎn)提示,指出OpenClaw的默認(rèn)配置“極為脆弱”,攻擊者一旦得手,能輕易獲取系統(tǒng)控制權(quán)。微軟安全團(tuán)隊(duì)也警告
OpenClaw火了,火到似乎人人都在討論“養(yǎng)蝦”。打開(kāi)社交媒體,滿(mǎn)屏都是“有了AI小龍蝦,我再也不用加班了”“我讓AI幫我訂了機(jī)票、寫(xiě)周報(bào)、點(diǎn)外賣(mài)”之類(lèi)的分享。于是,很多人開(kāi)始焦慮:別人都養(yǎng)了,我要不要也養(yǎng)一只?不養(yǎng)是不是就落伍了?先別急。在決定養(yǎng)“蝦”之前,我們先冷靜下來(lái),想清楚一個(gè)問(wèn)題:你到底
3月31日,科技圈上演了一場(chǎng)現(xiàn)實(shí)版的“代碼大逃殺”。一向以“閉源”為傲的AI巨頭Anthropic,因一個(gè)低級(jí)打包失誤,將旗下明星產(chǎn)品ClaudeCode的完整源代碼拱手送給了全世界。一次59.8MB的“裸奔”事情始于一個(gè)普通的周二早晨。Web3安全公司FuzzLab的實(shí)習(xí)研究員ChaofanSho
當(dāng)?shù)貢r(shí)間3月31日,人工智能明星公司OpenAI宣布完成一輪規(guī)模達(dá)1220億美元的私募融資,投后估值攀升至8520億美元,創(chuàng)下全球AI企業(yè)估值新紀(jì)錄,同時(shí)也刷新了科技行業(yè)私募融資的歷史最高規(guī)模。本輪融資籌備歷時(shí)數(shù)月,核心資金來(lái)自三家頭部科技企業(yè):亞馬遜承諾投資500億美元,英偉達(dá)與軟銀集團(tuán)分別出資3
“我也想養(yǎng)一只AI小龍蝦,但聽(tīng)說(shuō)安裝特別難,我連代碼都不會(huì)寫(xiě),怎么辦?”這是最近后臺(tái)收到最多的私信。面對(duì)OpenClaw這個(gè)技術(shù)門(mén)檻不低的AI智能體,很多普通人躍躍欲試,卻又望而卻步。于是,一個(gè)“代裝”產(chǎn)業(yè)應(yīng)運(yùn)而生——遠(yuǎn)程50到300元,上門(mén)500到1500元,幫你搞定一切。但問(wèn)題是:這些代裝服務(wù)靠
最近,身邊不少人都在討論“養(yǎng)AI小龍蝦”。這只叫OpenClaw的智能體,能替你自動(dòng)訂機(jī)票、寫(xiě)代碼、整理文件,聽(tīng)起來(lái)像請(qǐng)了一個(gè)24小時(shí)不休息的數(shù)字員工。但問(wèn)題來(lái)了——月薪五千的普通人,養(yǎng)得起嗎?我們先算一筆賬。養(yǎng)這只“蝦”,主要有三個(gè)花錢(qián)的地方。第一筆:硬件投入。OpenClaw創(chuàng)始人推薦用MacM
最近,“養(yǎng)AI小龍蝦”成了互聯(lián)網(wǎng)上的一股熱潮。這里的“小龍蝦”指的是OpenClaw——一個(gè)能替你自動(dòng)做事的人工智能體。訂機(jī)票、寫(xiě)代碼、整理文件,它就像一個(gè)24小時(shí)不休息的數(shù)字員工。聽(tīng)起來(lái)很酷,但很多人忽略了一個(gè)關(guān)鍵問(wèn)題:這只“蝦”需要你電腦的完整訪(fǎng)問(wèn)權(quán)限。也就是說(shuō),一旦你把它“請(qǐng)”進(jìn)家門(mén),它就能看
最近,互聯(lián)網(wǎng)上刮起了一股“養(yǎng)蝦熱”。這個(gè)“蝦”不是餐桌上的小龍蝦,而是一個(gè)叫OpenClaw的AI智能體。標(biāo)志是一只紅色小龍蝦,寓意不斷蛻殼成長(zhǎng)。OpenClaw到底是個(gè)什么東西?簡(jiǎn)單說(shuō),它是一個(gè)開(kāi)源的AI智能體框架,能裝進(jìn)你的電腦,替你自動(dòng)做事——訂機(jī)票、寫(xiě)代碼、整理文件,就像一個(gè)24小時(shí)不休息的