1. 創(chuàng)業(yè)頭條
  2. 前沿領(lǐng)域
  3. AI智能
  4. 正文

阿里云發(fā)布通義千問2.5,性能全面趕超GPT-4 Turbo

 2024-05-09 10:53  來源:互聯(lián)網(wǎng)  我來投稿 撤稿糾錯

  一鍵部署OpenClaw

5月9日消息,阿里云正式發(fā)布通義千問2.5,模型性能全面趕超GPT-4 Turbo,成為地表最強中文大模型。同時,通義千問最新開源的1100億參數(shù)模型在多個基準測評收獲最佳成績,超越Meta的Llama-3-70B,成為開源領(lǐng)域最強大模型。

相比通義千問2.1版本,通義千問2.5的理解能力、邏輯推理、指令遵循、代碼能力分別提升9%、16%、19%、10%,中文能力更是持續(xù)領(lǐng)先業(yè)界。在權(quán)威基準OpenCompass上,通義千問2.5得分追平GPT-4 Turbo,是該基準首次錄得國產(chǎn)大模型取得如此出色的成績。

通義還發(fā)布了最新款開源模型,1100億參數(shù)的Qwen1.5-110B,該模型在MMLU、TheoremQA、GPQA等基準測評中超越了Meta的Llama-3-70B模型;在HuggingFace推出的開源大模型排行榜Open LLM Leaderboard上,Qwen1.5-110B沖上榜首,再度證明通義開源系列業(yè)界最強的競爭力。

通義的多模態(tài)模型和專有能力模型也具備業(yè)界頂尖影響力。通義千問視覺理解模型Qwen-VL-Max在多個多模態(tài)標準測試中超越Gemini Ultra和GPT-4V,目前已在多家企業(yè)落地應(yīng)用;通義千問代碼大模型CodeQwen1.5-7B則是HuggingFace代碼模型榜單Big Code的頭名選手,還是國內(nèi)用戶規(guī)模第一的智能編碼助手通義靈碼的底座。

通義大模型問世一年多來,還發(fā)展出了業(yè)界領(lǐng)先的文生圖、智能編碼、文檔解析、音視頻理解等能力,企業(yè)客戶和開發(fā)者可以通過API調(diào)用、模型下載等方式接入通義,個人用戶可從通義APP、官網(wǎng)和小程序免費使用通義家族全棧服務(wù)。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關(guān)標簽
通義千問

相關(guān)文章

  • 通義千問三款主力模型再降價 最高降幅85%

    9月19日,繼5月首次大幅降價后,阿里云百煉平臺上的三款通義千問主力模型再次降價。Qwen-Turbo價格直降85%,低至百萬tokens0.3元,Qwen-Plus和Qwen-Max分別再降價80%和50%。其中,Qwen-Plus推理能力追平GPT4,可應(yīng)用于復雜任務(wù),是效果、速度及成本均衡的最

    標簽:
    通義千問
  • 通義千問升級旗艦?zāi)P蚎wen-Max,性能接近GPT-4o

    9月19日云棲大會,阿里云CTO周靖人宣布,通義旗艦?zāi)P蚎wen-Max全方位升級,性能接近GPT-4o。通義官網(wǎng)和通義APP的后臺模型均已切換為Qwen-Max,繼續(xù)免費為所有用戶提供服務(wù)。用戶也可通過阿里云百煉平臺調(diào)用Qwen-Max的API。相比上一代模型,Qwen-Max在訓練中使用了更多的

    標簽:
    通義千問
  • 通義靈碼AI編程能力再進化,說幾句話就能開發(fā)網(wǎng)頁

    9月19日,在2024杭州云棲大會上,隨著通義大模型能力的全面提升,阿里云通義靈碼迎來重磅升級,從一年前只能完成基礎(chǔ)的輔助編程任務(wù),進化到幾句話就能完成需求理解、任務(wù)拆解、代碼編寫、修改BUG、測試等開發(fā)任務(wù),最快幾分鐘可從0到1完成應(yīng)用開發(fā),提升數(shù)十倍開發(fā)效率。自去年首次亮相以來,通義靈碼已入職中

    標簽:
    通義千問
  • 通義萬相發(fā)布視頻生成模型,可一鍵創(chuàng)作影視級高清視頻

    9月19日,在杭州云棲大會上,阿里云CTO周靖人宣布通義萬相全面升級,并發(fā)布全新視頻生成模型,可生成影視級高清視頻,可應(yīng)用于影視創(chuàng)作、動畫設(shè)計、廣告設(shè)計等領(lǐng)域。即日起,所有用戶可通過通義APP及通義萬相官網(wǎng)免費體驗。據(jù)介紹,通義萬相首批上線文生視頻、圖生視頻功能,在文生視頻功能中,用戶輸入任意文字提

    標簽:
    通義千問
  • 通義千問重磅開源Qwen2.5,性能超越Llama

    9月19日云棲大會,阿里云CTO周靖人發(fā)布通義千問新一代開源模型Qwen2.5,旗艦?zāi)P蚎wen2.5-72B性能超越Llama405B,再登全球開源大模型王座。Qwen2.5全系列涵蓋多個尺寸的大語言模型、多模態(tài)模型、數(shù)學模型和代碼模型,每個尺寸都有基礎(chǔ)版本、指令跟隨版本、量化版本,總計上架100

    標簽:
    通義千問
  • “養(yǎng)龍蝦”為什么突然火了?OpenClaw很強,但普通人真的適合嗎?

    一只“龍蝦”,火遍全網(wǎng)“今天你養(yǎng)龍蝦了嗎?”這句話在2026年初,迅速取代“吃了嗎”成為社交媒體上的新晉暗號。別誤會,這不是什么水產(chǎn)養(yǎng)殖新風口。這里說的“龍蝦”,是一款名為OpenClaw的開源AI智能體。因為它的圖標是一只紅色龍蝦,網(wǎng)友們便把部署、配置和使用它的過程,戲稱為“養(yǎng)龍蝦”。一個開源軟件

  • 一秒當導演:小云雀上線短劇Agent,10萬字劇本一鍵生成60集

    凌晨兩點,小王合上筆記本,揉了揉酸脹的眼睛。花了一個月寫出來的10萬字短劇劇本躺在硬盤里,要真正把它拍成劇,得找演員、租場地、請攝像、做后期……粗算下來少說要幾十萬,他只能把劇本繼續(xù)鎖在抽屜里。不過,現(xiàn)在小王的劇本可以“見光”了。2026年3月19日,字節(jié)跳動旗下的小云雀AI正式上線了短劇Agent

    標簽:
    大模型
  • 騰訊云推出“龍蝦”記憶服務(wù),準確率飆升近六成

    你一定遇到過這樣的場景:明明剛和AI助手聊了半個小時的項目細節(jié),退出會話后重新打開,它卻像個失憶患者一樣,連你上一輪說過什么背景信息都忘得一干二凈,你又得從頭把需求講一遍。這種“聊完就忘”的體驗,讓無數(shù)使用AI智能體的用戶深感頭疼。為了解決這一普遍困擾,騰訊云在4月3日正式推出了名為“龍蝦”的記憶服

  • 谷歌 Gemma 4 正式開源,開源賽道迎來變局!

    4月3日凌晨,谷歌DeepMind悄然甩出一枚重磅炸彈——全新一代開源大模型Gemma4正式發(fā)布,以極其寬松的Apache2.0協(xié)議向全球開發(fā)者免費開放。這是自2025年3月發(fā)布Gemma3以來,谷歌時隔整整一年的重大迭代。本次發(fā)布的Gemma4包含四個不同規(guī)格的版本:E2B(有效20億參數(shù))、E4

    標簽:
    大模型

熱門排行

編輯推薦