9月24日,在2025杭州云棲大會(huì)上,阿里發(fā)布通義萬(wàn)相Wan2.5 preview系列模型,涵蓋文生視頻、圖生視頻、文生圖和圖像編輯四大模型,其中,通義萬(wàn)相2.5視頻生成模型能生成和畫面匹配的人聲、音效和音樂(lè)BGM,首次實(shí)現(xiàn)音畫同步的視頻生成能力,進(jìn)一步降低電影級(jí)視頻創(chuàng)作的門檻。即日起,用戶可在阿里云百煉平臺(tái)調(diào)用API,或在通義萬(wàn)相官網(wǎng)直接體驗(yàn)。

全新的通義萬(wàn)相2.5在創(chuàng)作能力上實(shí)現(xiàn)了全面升級(jí):視頻生成時(shí)長(zhǎng)從5秒提升至10秒,單次生成可實(shí)現(xiàn)更完整的劇情故事;支持24幀每秒的1080P高清視頻生成,畫面質(zhì)量進(jìn)一步提升,滿足電影級(jí)場(chǎng)景的創(chuàng)作需求;與此同時(shí),模型指令遵循能力進(jìn)一步提升,在視頻生成任務(wù)中可理解運(yùn)鏡等復(fù)雜連續(xù)變化指令控制,圖像編輯任務(wù)也可以跟隨指令一鍵實(shí)現(xiàn)人物變身、風(fēng)格變化等效果。
據(jù)介紹,相比前幾代通義萬(wàn)相模型,通義萬(wàn)相2.5在技術(shù)架構(gòu)上實(shí)現(xiàn)了重大更新:首次采用原生多模態(tài)架構(gòu),在同一套框架下支持理解和生成等多種任務(wù),支持文本、圖像、視頻、音頻多種模態(tài)的輸入和輸出,能實(shí)現(xiàn)音畫同步的視頻生成等多模態(tài)能力。用戶輸入提示詞即可生成人聲、環(huán)境音效和背景音樂(lè),并且精準(zhǔn)與畫面內(nèi)容、人物口型匹配,讓視頻演繹更加生動(dòng)形象。通義萬(wàn)相2.5也支持輸入一段音頻作為參考,來(lái)驅(qū)動(dòng)文字或圖片生成音畫同步的視頻。
例如,輸入Prompt:仰視角度拍攝,全景,日光,晴天光,側(cè)光,暖色調(diào),中心構(gòu)圖。一名外國(guó)男子在城市公園的水泥廣場(chǎng)上玩滑板,他約二十多歲,身材健碩,深色短發(fā)藏在黑色棒球帽下,身穿深灰色連帽上衣和黑色工裝褲,腳踩一雙黑白拼色運(yùn)動(dòng)鞋。鏡頭從低角度仰拍,突出其騰空動(dòng)作的張力。他站在滑板上加速前行,身體前傾,雙臂自然張開(kāi)以維持平衡;隨后猛然躍起,右腳輕踢板尾,滑板在空中完成180度翻轉(zhuǎn),他迅速下壓接住滑板,雙腳精準(zhǔn)落回板面,穩(wěn)穩(wěn)著地后繼續(xù)向前滑行。背景中,三兩名滑板者在遠(yuǎn)處滑行穿梭,梧桐樹(shù)葉在微風(fēng)中輕輕搖曳,陽(yáng)光穿過(guò)樹(shù)葉間隙灑下斑駁光影,投射在地面和滑板輪跡上。伴隨著節(jié)奏鮮明的都市電子音樂(lè),背景傳來(lái)輪子摩擦地面的沙沙聲與遠(yuǎn)處隱約的交談聲。男子落地瞬間輕哼一聲“Yeah!”,語(yǔ)氣輕快自信。

通義萬(wàn)相能精準(zhǔn)理解復(fù)雜指令的多個(gè)關(guān)鍵詞,生成一段男子滑板的動(dòng)感視頻,不僅實(shí)現(xiàn)動(dòng)作、拍攝角度和光影遵循指令,視頻展現(xiàn)的人聲、滑板滾動(dòng)音效以及背景音也和畫面內(nèi)容、指令保持同步。

輸入一張圖片和一段文字,通義萬(wàn)相可生成音畫同步的視頻
此次,通義萬(wàn)相2.5還全面升級(jí)了圖像生成能力,可生成中英文文字和圖表,包含復(fù)雜文字排版、藝術(shù)海報(bào)、流程圖、架構(gòu)圖等,同時(shí)支持圖像編輯功能,輸入一句話即可完成P圖。

通義萬(wàn)相模型家族已支持文生圖、文生視頻、圖生視頻、人聲生視頻和動(dòng)作生成等10多種視覺(jué)創(chuàng)作能力,累計(jì)生成3.9億張圖片、7000萬(wàn)個(gè)視頻。自今年 2 月以來(lái),通義萬(wàn)相已連續(xù)開(kāi)源20多款模型,在開(kāi)源社區(qū)和三方平臺(tái)的下載量已超3000萬(wàn),是開(kāi)源社區(qū)最受歡迎的視頻生成模型之一。
申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!
2026年剛開(kāi)年,全世界最狂的那個(gè)男人,穿著他的經(jīng)典黑皮衣,在CES舞臺(tái)上發(fā)出了未來(lái)十年的信號(hào)。他搞了個(gè)“能吃飽套餐”:6個(gè)包子+一碟小菜+一碗粥=肉包子套餐,這樣以后你只要買一個(gè)套餐就能吃飽了。(Rubin平臺(tái))同時(shí)他們店里還免費(fèi)提供的筷子、勺子、蘸料、醬油、醋、水果、零食等等。(開(kāi)放10萬(wàn)億語(yǔ)言
12月12日-14日,2025全球開(kāi)發(fā)者先鋒大會(huì)暨國(guó)際具身智能技能大賽(GDPS2025)于上海張江科學(xué)會(huì)堂舉行,大會(huì)以具身智能競(jìng)技為核心,融合了技術(shù)比拼、產(chǎn)業(yè)展示與科普體驗(yàn),為全球觀眾呈現(xiàn)出具身智能的現(xiàn)在與未來(lái)。上海開(kāi)普勒機(jī)器人有限公司(以下簡(jiǎn)稱"開(kāi)普勒機(jī)器人")攜明星產(chǎn)品K2"大黃蜂"亮相,并參
在數(shù)字化與智能化深度交織的時(shí)代浪潮中,安全的邊界不斷延展,技術(shù)的演進(jìn)正引領(lǐng)產(chǎn)業(yè)邁向新一輪變革。10月24日,以“弈動(dòng)Dynamic·數(shù)智躍遷博弈無(wú)界”為主題的2025TechWorld智慧安全大會(huì)在北京盛大召開(kāi)。來(lái)自國(guó)家部委、院士學(xué)者、高??蒲袡C(jī)構(gòu)和企業(yè)的權(quán)威專家與業(yè)界精英齊聚北京,共議AI安全、數(shù)
2025年10月25日,2025世界青年科學(xué)家峰會(huì)之人工智能(AI)融合創(chuàng)新發(fā)展論壇在浙江溫州成功舉辦。本次論壇由國(guó)際院士科創(chuàng)中心主辦,中國(guó)投資協(xié)會(huì)能源投資專業(yè)委員會(huì)、溫港院士科創(chuàng)中心承辦,中國(guó)電工技術(shù)學(xué)會(huì)、中科先進(jìn)技術(shù)溫州研究院與溫州市電力工程學(xué)會(huì)提供支持,以“甌江論道-AI賦能綠色發(fā)展”為主題,
我覺(jué)得我們AI的目標(biāo)是:從芯片設(shè)計(jì)到軟件生態(tài),全鏈路自主開(kāi)發(fā),建立可控的世界級(jí)AI體系。所以這是俺對(duì)未來(lái)5年中國(guó)AI圈的展望和判斷。(1)2026年,英偉達(dá)造車、國(guó)產(chǎn)開(kāi)車26年國(guó)產(chǎn)芯片會(huì)在推理和垂直場(chǎng)景上發(fā)力。以DeepSeek為代表,大多數(shù)AI大模型會(huì)以軟件彌補(bǔ)硬件不足,所以訓(xùn)練和推理分開(kāi),訓(xùn)練就
文/道哥在深陷“后門”風(fēng)波、接受網(wǎng)信辦問(wèn)詢之后,英偉達(dá)的“特供版”H20芯片,又有了新消息。近日,美國(guó)科技媒體《TheInformation》援引知情人士消息稱,英偉達(dá)已悄然向其關(guān)鍵供應(yīng)商——包括負(fù)責(zé)封裝的安靠科技、供應(yīng)高帶寬內(nèi)存的三星電子、以及承擔(dān)后端處理的富士康發(fā)出指令,要求暫停所有與H20AI
文/二風(fēng)來(lái)源/節(jié)點(diǎn)財(cái)經(jīng)一場(chǎng)關(guān)于“中國(guó)芯”的IPO審議,正把投資者們的目光鎖定在上交所。根據(jù)上交所發(fā)布的公告,上市審核委員會(huì)已定于9月26日審議摩爾線程的科創(chuàng)板首發(fā)申請(qǐng)。作為中國(guó)半導(dǎo)體自主化浪潮中最受矚目的“考生”之一,包括其創(chuàng)始人顯赫的英偉達(dá)背景、高達(dá)80億元人民幣的募資雄心,以及在國(guó)產(chǎn)GPU領(lǐng)域取
技術(shù)的進(jìn)步永無(wú)止境,繼創(chuàng)下TPC-C性能&性價(jià)比雙冠之后,阿里云PolarDB云原生數(shù)據(jù)庫(kù)再度實(shí)現(xiàn)關(guān)鍵突破。9月24日杭州云棲大會(huì)上,阿里云宣布推出全球首款基于CXL(ComputeExpressLink)2.0Switch技術(shù)的PolarDB數(shù)據(jù)庫(kù)專用服務(wù)器。在原有RDMA網(wǎng)絡(luò)的基礎(chǔ)上,Polar