1. 創(chuàng)業(yè)頭條
  2. 前沿領(lǐng)域
  3. AI智能
  4. 正文

阿里發(fā)布Qwen3-Max,性能超GPT5,躋身全球前三

 2025-09-24 15:07  來(lái)源:互聯(lián)網(wǎng)  我來(lái)投稿 撤稿糾錯(cuò)

  阿里云優(yōu)惠券 先領(lǐng)券再下單

9月24日,2025云棲大會(huì)開(kāi)幕,阿里通義旗艦?zāi)P蚎wen3-Max重磅亮相,性能超過(guò)GPT5、Claude Opus 4等,躋身全球前三。Qwen3-Max包括指令(Instruct)和推理(Thinking)兩大版本,其預(yù)覽版已在 Chatbot Arena 排行榜上位列第三,正式版性可望再度實(shí)現(xiàn)突破。

Qwen3-Max為通義千問(wèn)家族中最大、最強(qiáng)的基礎(chǔ)模型。該模型預(yù)訓(xùn)練數(shù)據(jù)量達(dá)36T tokens,總參數(shù)超過(guò)萬(wàn)億,擁有極強(qiáng)的Coding編程能力和Agent工具調(diào)用能力。在大模型用Coding解決真實(shí)世界問(wèn)題的SWE-Bench Verified測(cè)試中,Instruct版本斬獲69.6分,位列全球第一梯隊(duì);在聚焦Agent工具調(diào)用能力的Tau2-Bench測(cè)試中,Qwen3-Max取得突破性的74.8分,超過(guò)Claude Opus4和DeepSeek-V3.1。

 【圖說(shuō)】:Qwen3-Max-Instrurct測(cè)評(píng)分?jǐn)?shù)

Qwen3-Max的推理增強(qiáng)版本Qwen3-Max-Thinking-Heavy也展現(xiàn)出非凡性能,結(jié)合工具調(diào)用和并行推理技術(shù),其推理能力創(chuàng)下新高,尤其在聚焦數(shù)學(xué)推理的AIME 25和HMMT測(cè)試中,均達(dá)到突破性的滿分100分,為國(guó)內(nèi)首次。Qwen3-Max推理模型之所以能夠取得優(yōu)異成績(jī),原因在于大模型在解數(shù)學(xué)題時(shí)懂得調(diào)動(dòng)工具,能夠?qū)懘a做題,同時(shí),增加測(cè)試時(shí)的計(jì)算資源,也讓模型表現(xiàn)變得更好。

【圖說(shuō)】:Qwen3-Max-Thinking-Heavy 測(cè)評(píng)分?jǐn)?shù)

大模型預(yù)訓(xùn)練原理Scaling Law(規(guī)?;▌t)認(rèn)為,持續(xù)地增長(zhǎng)數(shù)據(jù)和參數(shù)規(guī)模,是通向 AGI 的可能路徑之一。由于自然數(shù)據(jù)的數(shù)量有限,當(dāng)前有部分學(xué)者認(rèn)為預(yù)訓(xùn)練的Scaling Law即將逼近上限,而Qwen3-Max的性能突破顯示,繼續(xù)增大數(shù)據(jù)、模型參數(shù),依然能鍛造出更強(qiáng)的模型,給予了大家更多的信心。目前,通義千問(wèn)系列模型已經(jīng)實(shí)現(xiàn)從0.5B到超萬(wàn)億的全尺寸覆蓋,包含三百多個(gè)大模型,可滿足不同場(chǎng)景的需求。

即日起,用戶可在通義千問(wèn)QwenChat上免費(fèi)體驗(yàn)Qwen3-Max,也可通過(guò)阿里云百煉平臺(tái)調(diào)用API服務(wù)。

申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)文章

  • H20芯片開(kāi)賣即叫停,英偉達(dá)如何解圍?

    文/道哥在深陷“后門”風(fēng)波、接受網(wǎng)信辦問(wèn)詢之后,英偉達(dá)的“特供版”H20芯片,又有了新消息。近日,美國(guó)科技媒體《TheInformation》援引知情人士消息稱,英偉達(dá)已悄然向其關(guān)鍵供應(yīng)商——包括負(fù)責(zé)封裝的安靠科技、供應(yīng)高帶寬內(nèi)存的三星電子、以及承擔(dān)后端處理的富士康發(fā)出指令,要求暫停所有與H20AI

    標(biāo)簽:
    英偉達(dá)
  • 真正的「國(guó)產(chǎn)英偉達(dá)」來(lái)了

    文/二風(fēng)來(lái)源/節(jié)點(diǎn)財(cái)經(jīng)一場(chǎng)關(guān)于“中國(guó)芯”的IPO審議,正把投資者們的目光鎖定在上交所。根據(jù)上交所發(fā)布的公告,上市審核委員會(huì)已定于9月26日審議摩爾線程的科創(chuàng)板首發(fā)申請(qǐng)。作為中國(guó)半導(dǎo)體自主化浪潮中最受矚目的“考生”之一,包括其創(chuàng)始人顯赫的英偉達(dá)背景、高達(dá)80億元人民幣的募資雄心,以及在國(guó)產(chǎn)GPU領(lǐng)域取

    標(biāo)簽:
    英偉達(dá)
  • AI視頻生成賽道“分野”:小廠重產(chǎn)品,大廠重生態(tài)

    AI視頻生成賽道“分野”:小廠重產(chǎn)品,大廠重生態(tài)

    標(biāo)簽:
    騰訊
    阿里巴巴
    快手
  • 數(shù)據(jù)庫(kù)進(jìn)入“內(nèi)存自由”時(shí)代!阿里云PolarDB發(fā)布全球首個(gè)CXL數(shù)據(jù)庫(kù)服務(wù)器

    技術(shù)的進(jìn)步永無(wú)止境,繼創(chuàng)下TPC-C性能&性價(jià)比雙冠之后,阿里云PolarDB云原生數(shù)據(jù)庫(kù)再度實(shí)現(xiàn)關(guān)鍵突破。9月24日杭州云棲大會(huì)上,阿里云宣布推出全球首款基于CXL(ComputeExpressLink)2.0Switch技術(shù)的PolarDB數(shù)據(jù)庫(kù)專用服務(wù)器。在原有RDMA網(wǎng)絡(luò)的基礎(chǔ)上,Polar

  • 為AI時(shí)代云服務(wù)器量身定制 阿里云操作系統(tǒng)Alinux 4重磅發(fā)布

    2025年9月24日,在杭州舉辦的云棲大會(huì)上,阿里云正式發(fā)布全新一代服務(wù)器操作系統(tǒng)AlibabaCloudLinux4(簡(jiǎn)稱Alinux4)。Alinux4基于Linux6.6內(nèi)核打造,是首個(gè)全面遵循龍蜥社區(qū)“開(kāi)源生態(tài)合作倡議”規(guī)范的商業(yè)發(fā)行版。它不僅兼容主流開(kāi)源社區(qū)生態(tài),更針對(duì)阿里云最新9代ECS

  • 阿里云重磅發(fā)布AI安全護(hù)欄 五項(xiàng)安全能力護(hù)航AI安全

    9月24日,杭州云棲大會(huì)技術(shù)主論壇上,阿里云重磅發(fā)布AI安全護(hù)欄,提供五項(xiàng)核心安全能力,護(hù)航AI安全。一方面為客戶提供融入AIAgent開(kāi)發(fā)全鏈路的原生安全防護(hù),另一方面持續(xù)用AI賦能安全產(chǎn)品智能化升級(jí),打造Agentic-SOC安全運(yùn)營(yíng),提升安全威脅檢測(cè)和響應(yīng)效率。在過(guò)去的一年,AIAgent正在

  • 魔搭社區(qū)國(guó)際版上線,并發(fā)布科學(xué)智能專區(qū)與AIGC創(chuàng)作引擎

    9月24日,魔搭社區(qū)舉辦了“全球協(xié)作?科學(xué)突破?創(chuàng)意無(wú)限”的專題論壇,并發(fā)布魔搭社區(qū)國(guó)際版、科學(xué)智能專區(qū)與AIGC創(chuàng)作引擎FlowBench,旨在連接全球開(kāi)發(fā)者、加速科研范式創(chuàng)新、賦能創(chuàng)意表達(dá)。自2022年11月初成立至今,魔搭社區(qū)已成長(zhǎng)為中國(guó)最大AI開(kāi)源社區(qū),其模型數(shù)量已突破10萬(wàn),服務(wù)了全球20

  • 七連發(fā)!阿里多款重磅發(fā)布亮相云棲大會(huì)

    9月24日,2025云棲大會(huì)現(xiàn)場(chǎng),阿里云CTO周靖人接連發(fā)布了七款大模型技術(shù)產(chǎn)品。七款技術(shù)產(chǎn)品覆蓋語(yǔ)言、語(yǔ)音、視覺(jué)、多模態(tài)、代碼等模型領(lǐng)域,在模型智能水平、Agent工具調(diào)用以及Coding能力、深度推理、多模態(tài)等方面均實(shí)現(xiàn)突破。在大語(yǔ)言模型中,阿里通義旗艦?zāi)P蚎wen3-Max全新亮相,性能超過(guò)G

  • 阿里云擴(kuò)建全球基礎(chǔ)設(shè)施,將新增巴西、法國(guó)和荷蘭數(shù)據(jù)中心

    9月24日,阿里云在云棲大會(huì)上宣布新一輪全球基礎(chǔ)設(shè)施擴(kuò)建計(jì)劃:將在巴西、法國(guó)和荷蘭首次設(shè)立云計(jì)算地域節(jié)點(diǎn)(region),并將擴(kuò)建墨西哥、日本、韓國(guó)、馬來(lái)西亞和迪拜的數(shù)據(jù)中心,以便更好服務(wù)全球客戶日益增長(zhǎng)的AI和云計(jì)算需求。目前,阿里云在全球29個(gè)地區(qū)運(yùn)營(yíng)91個(gè)可用區(qū),是中國(guó)最大、亞太第一的云服務(wù)商

  • 阿里AI成中國(guó)企業(yè)首選,Agent和Coding加速AI滲透

    9月24日,在2025云棲大會(huì)上,阿里巴巴集團(tuán)CEO、阿里云智能集團(tuán)董事長(zhǎng)兼CEO吳泳銘表示,當(dāng)下行業(yè)處于“自主行動(dòng)”階段,AI掌握工具使用和編程能力以“輔助人”。記者獲悉,阿里云百煉平臺(tái)已有超20萬(wàn)開(kāi)發(fā)者開(kāi)發(fā)了80多萬(wàn)個(gè)Agent。同時(shí),通義靈碼插件下載量已超2200萬(wàn),累計(jì)為開(kāi)發(fā)者生成超60億行

熱門排行

編輯推薦