9月24日,在2025杭州云棲大會上,阿里發(fā)布通義萬相Wan2.5 preview系列模型,涵蓋文生視頻、圖生視頻、文生圖和圖像編輯四大模型,其中,通義萬相2.5視頻生成模型能生成和畫面匹配的人聲、音效和音樂BGM,首次實現(xiàn)音畫同步的視頻生成能力,進一步降低電影級視頻創(chuàng)作的門檻。即日起,用戶可在阿里云百煉平臺調(diào)用API,或在通義萬相官網(wǎng)直接體驗。
全新的通義萬相2.5在創(chuàng)作能力上實現(xiàn)了全面升級:視頻生成時長從5秒提升至10秒,單次生成可實現(xiàn)更完整的劇情故事;支持24幀每秒的1080P高清視頻生成,畫面質(zhì)量進一步提升,滿足電影級場景的創(chuàng)作需求;與此同時,模型指令遵循能力進一步提升,在視頻生成任務(wù)中可理解運鏡等復(fù)雜連續(xù)變化指令控制,圖像編輯任務(wù)也可以跟隨指令一鍵實現(xiàn)人物變身、風格變化等效果。
據(jù)介紹,相比前幾代通義萬相模型,通義萬相2.5在技術(shù)架構(gòu)上實現(xiàn)了重大更新:首次采用原生多模態(tài)架構(gòu),在同一套框架下支持理解和生成等多種任務(wù),支持文本、圖像、視頻、音頻多種模態(tài)的輸入和輸出,能實現(xiàn)音畫同步的視頻生成等多模態(tài)能力。用戶輸入提示詞即可生成人聲、環(huán)境音效和背景音樂,并且精準與畫面內(nèi)容、人物口型匹配,讓視頻演繹更加生動形象。通義萬相2.5也支持輸入一段音頻作為參考,來驅(qū)動文字或圖片生成音畫同步的視頻。
例如,輸入Prompt:仰視角度拍攝,全景,日光,晴天光,側(cè)光,暖色調(diào),中心構(gòu)圖。一名外國男子在城市公園的水泥廣場上玩滑板,他約二十多歲,身材健碩,深色短發(fā)藏在黑色棒球帽下,身穿深灰色連帽上衣和黑色工裝褲,腳踩一雙黑白拼色運動鞋。鏡頭從低角度仰拍,突出其騰空動作的張力。他站在滑板上加速前行,身體前傾,雙臂自然張開以維持平衡;隨后猛然躍起,右腳輕踢板尾,滑板在空中完成180度翻轉(zhuǎn),他迅速下壓接住滑板,雙腳精準落回板面,穩(wěn)穩(wěn)著地后繼續(xù)向前滑行。背景中,三兩名滑板者在遠處滑行穿梭,梧桐樹葉在微風中輕輕搖曳,陽光穿過樹葉間隙灑下斑駁光影,投射在地面和滑板輪跡上。伴隨著節(jié)奏鮮明的都市電子音樂,背景傳來輪子摩擦地面的沙沙聲與遠處隱約的交談聲。男子落地瞬間輕哼一聲“Yeah!”,語氣輕快自信。
通義萬相能精準理解復(fù)雜指令的多個關(guān)鍵詞,生成一段男子滑板的動感視頻,不僅實現(xiàn)動作、拍攝角度和光影遵循指令,視頻展現(xiàn)的人聲、滑板滾動音效以及背景音也和畫面內(nèi)容、指令保持同步。
輸入一張圖片和一段文字,通義萬相可生成音畫同步的視頻
此次,通義萬相2.5還全面升級了圖像生成能力,可生成中英文文字和圖表,包含復(fù)雜文字排版、藝術(shù)海報、流程圖、架構(gòu)圖等,同時支持圖像編輯功能,輸入一句話即可完成P圖。
通義萬相模型家族已支持文生圖、文生視頻、圖生視頻、人聲生視頻和動作生成等10多種視覺創(chuàng)作能力,累計生成3.9億張圖片、7000萬個視頻。自今年 2 月以來,通義萬相已連續(xù)開源20多款模型,在開源社區(qū)和三方平臺的下載量已超3000萬,是開源社區(qū)最受歡迎的視頻生成模型之一。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!
技術(shù)的進步永無止境,繼創(chuàng)下TPC-C性能&性價比雙冠之后,阿里云PolarDB云原生數(shù)據(jù)庫再度實現(xiàn)關(guān)鍵突破。9月24日杭州云棲大會上,阿里云宣布推出全球首款基于CXL(ComputeExpressLink)2.0Switch技術(shù)的PolarDB數(shù)據(jù)庫專用服務(wù)器。在原有RDMA網(wǎng)絡(luò)的基礎(chǔ)上,Polar
2025年9月24日,在杭州舉辦的云棲大會上,阿里云正式發(fā)布全新一代服務(wù)器操作系統(tǒng)AlibabaCloudLinux4(簡稱Alinux4)。Alinux4基于Linux6.6內(nèi)核打造,是首個全面遵循龍蜥社區(qū)“開源生態(tài)合作倡議”規(guī)范的商業(yè)發(fā)行版。它不僅兼容主流開源社區(qū)生態(tài),更針對阿里云最新9代ECS
9月24日,杭州云棲大會技術(shù)主論壇上,阿里云重磅發(fā)布AI安全護欄,提供五項核心安全能力,護航AI安全。一方面為客戶提供融入AIAgent開發(fā)全鏈路的原生安全防護,另一方面持續(xù)用AI賦能安全產(chǎn)品智能化升級,打造Agentic-SOC安全運營,提升安全威脅檢測和響應(yīng)效率。在過去的一年,AIAgent正在
9月24日,魔搭社區(qū)舉辦了“全球協(xié)作?科學突破?創(chuàng)意無限”的專題論壇,并發(fā)布魔搭社區(qū)國際版、科學智能專區(qū)與AIGC創(chuàng)作引擎FlowBench,旨在連接全球開發(fā)者、加速科研范式創(chuàng)新、賦能創(chuàng)意表達。自2022年11月初成立至今,魔搭社區(qū)已成長為中國最大AI開源社區(qū),其模型數(shù)量已突破10萬,服務(wù)了全球20
9月24日,2025云棲大會現(xiàn)場,阿里云CTO周靖人接連發(fā)布了七款大模型技術(shù)產(chǎn)品。七款技術(shù)產(chǎn)品覆蓋語言、語音、視覺、多模態(tài)、代碼等模型領(lǐng)域,在模型智能水平、Agent工具調(diào)用以及Coding能力、深度推理、多模態(tài)等方面均實現(xiàn)突破。在大語言模型中,阿里通義旗艦?zāi)P蚎wen3-Max全新亮相,性能超過G
9月24日,阿里云在云棲大會上宣布新一輪全球基礎(chǔ)設(shè)施擴建計劃:將在巴西、法國和荷蘭首次設(shè)立云計算地域節(jié)點(region),并將擴建墨西哥、日本、韓國、馬來西亞和迪拜的數(shù)據(jù)中心,以便更好服務(wù)全球客戶日益增長的AI和云計算需求。目前,阿里云在全球29個地區(qū)運營91個可用區(qū),是中國最大、亞太第一的云服務(wù)商
9月24日,在2025云棲大會上,阿里巴巴集團CEO、阿里云智能集團董事長兼CEO吳泳銘表示,當下行業(yè)處于“自主行動”階段,AI掌握工具使用和編程能力以“輔助人”。記者獲悉,阿里云百煉平臺已有超20萬開發(fā)者開發(fā)了80多萬個Agent。同時,通義靈碼插件下載量已超2200萬,累計為開發(fā)者生成超60億行
記者在2025云棲大會上獲悉,網(wǎng)易已接入通義千問(Qwen)打造游戲自動測試系統(tǒng),幫助游戲研發(fā)提效50%。網(wǎng)易集團執(zhí)行副總裁、網(wǎng)易雷火事業(yè)群負責人胡志鵬在演講中透露,在游戲開發(fā)中,代碼編寫與測試調(diào)試是非常消耗時間的環(huán)節(jié)。當前,網(wǎng)易借助Qwen3-coder等模型正在推動AI輔助智能生成代碼,打造自動
9月24日,在2025杭州云棲大會上,阿里發(fā)布全新語音模型家族通義百聆,通義百聆涵蓋語音識別大模型Fun-ASR、語音合成大模型Fun-CosyVoice。Fun-ASR基于數(shù)千萬小時真實語音數(shù)據(jù)訓練而成,具備強大的上下文理解能力與行業(yè)適應(yīng)性,可實時處理10多種語言;Fun-CosyVoice可提供