1. 創(chuàng)業(yè)頭條
  2. 前沿領域
  3. AI智能
  4. 正文

OpenAI Sora畫的餅,AI行業(yè)集體給它圓了......嗎?

 2024-08-26 10:58  來源:A5專欄  我來投稿 撤稿糾錯

  一鍵部署OpenClaw

AI文生視頻領域,幾乎只剩Sora還是個期貨了。

最近兩個月,國內外的AI-generated Video應用持續(xù)爆發(fā),中國的快手、字節(jié)、智譜AI、生數(shù)科技、愛詩科技,海外的谷歌、Luma、Runway,格局如八仙過海。

雖然不同平臺水平差異依舊存在,但整體可用性已經大大提高,而且風格化特征也比較全面。唯一的缺憾是,在融入工作流方面,AI視頻工具們的水平還是差了一點。Sora畫的餅,要交給這些后來者去圓了。

放棄期貨,文生視頻應用爆發(fā)

業(yè)界民間都把視頻視為AI應用落地的重點領域。英偉達CEO黃仁勛在7月30日的全球頂級計算機圖形學會議SIGGRAPH 2024上邀請了Meta的CEO扎克伯格進行對話,雙方都認可視頻能力會是AI大模型的進化方向。

出身于英偉達研究小組的Luma AI首席科學家宋佳銘,在與a16z合伙人Anjney Midha對談時說,視頻關聯(lián)著3D世界,從學習角度看,視頻數(shù)據(jù)使模型更好地理解和推理3D世界。所以,實時高質量的視頻生成,最終會推動具身AI的發(fā)展。

視頻就是這樣一座“橋”,而現(xiàn)在大量的AI公司正在試圖搶先通過它,尤其是OpenAI讓Sora變成了外界用不到的期貨,給了其他平臺進一步發(fā)展的空間。

(整理自公開信息)

(圖源:天眼查)

超長戰(zhàn)線背后是這些公司的試探。一部分是關于商業(yè)模式,另一部分是關于技術應用前景。

可靈、即夢、Vidu等都推出了會員訂閱模式,在C端進行應用普及化嘗試。愛詩科技創(chuàng)始人王長虎此前在接受財新采訪時表示:“愛詩目前的策略以2C(面向消費者)為主,廣泛收集國內外用戶反饋,以更好地基于用戶體驗迭代底層模型。”至于更遠的應用,現(xiàn)在來談則為時尚早,主要是因為C端的收費模式無法承擔成本。

Luma AI采取了To C的產品形態(tài),不過它原本專注于3D領域,進入視頻生成領域是為了探索3D生成與重建的更多可能性,以視頻驅動3D發(fā)展。這在產業(yè)領域有更多的應用前景,例如批量制造電影需要的三維素材等。

最重要的是,Luma AI的期望不是售賣技術或者素材,而是建立類似TikTok這樣的平臺,也就是一個基于3D的生態(tài)系統(tǒng)。王長虎也在和極客公園創(chuàng)始人張鵬對話時表示,愛詩科技也瞄準的是“AIGC時代的平臺性機會”,但平臺的形態(tài)暫時無法預測,因為AI產業(yè)不會以復制現(xiàn)在已有的平臺的方式成長。

不僅如此,目前讓AI-generated Video進入完整工作流的應用已經在成形。開源視頻編輯工具Clapper最近熱度上升,它的特色就是集合各類AI技術,用prompt的方式調動AI Agent生成和迭代故事,直接跳過了手工編輯文件的過程。

(圖源:機器之心)

由此可見,AI-generated Video的進化速度遠比我們想象得要快。目前,行業(yè)的重點無疑在于生成速度和生成效率兩個方面。但是,大模型并不提供完全確定的商業(yè)模式方向,這更多取決于團隊的選擇。而在這個過程中,除了商業(yè)化之外,AI公司還要思考怎么避免陷入合規(guī)困境、成本困境。所以,把文生視頻變得成熟并不容易,現(xiàn)在僅僅相當于ChatGPT剛剛問世的階段。

AI-generated Video的“硬傷”和突破口

a16z之前就發(fā)表過觀點,巨頭在從科研成果到商業(yè)產品的轉化中需要更關注法律安全、版權等問題,所以往往效率會慢。我們不去考慮Sora是不是因為這個原因始終不露面,單看行業(yè)都要面對的相關問題,邏輯其實是一樣的。

1.商業(yè)化的“落差”,目前的AI-generated Video很難滿足甲方們的需求

彭博社曾報道,OpenAI一直試圖向好萊塢推薦Sora,但并不成功。用Sora制作的第一則商業(yè)化廣告是6月公開的玩具反斗城廣告。然而,這則視頻不但用了一些舊素材,公開新聞稿也沒有說完全由AI生成。

導演Nik Kleverov還在一條已經刪除的動態(tài)里表示,制作這些鏡頭的創(chuàng)意機構Native Foreign提供了大約十幾個工作人員參與工作,Sora支持了80%到85%的流程。這對需要高效低成本的AI-generated Video來說算不上什么好消息。

2.訓練成本、高質量數(shù)據(jù)集難以滿足

視頻的本質可以視為一系列圖像,圖像有很多公開的數(shù)據(jù)集,但是視頻沒有。OpenAI遇到過違規(guī)使用YouTube視頻進行訓練的指控,英偉達最近被媒體曝光從Netflix和YouTube收集了大量數(shù)據(jù),用來訓練自己的Cosmos項目,用于支持其AI產品往現(xiàn)實世界發(fā)展。它每天可以下載相當于80年的視頻內容。

這體現(xiàn)了兩個關鍵點:一是黃仁勛和Luma的觀點類似,AI視頻的發(fā)展確實對AI進入3D世界意義重大,英偉達也是這樣做的:文本——圖像——視頻——三維模型——現(xiàn)實世界。二是視頻數(shù)據(jù)集是個大問題,除了版權問題,這些視頻數(shù)據(jù)還缺乏標簽,斯坦福大學教授Stefano Ermon說,現(xiàn)階段缺乏篩選和過濾好視頻的方法,而且篩選后還要考慮它們的標簽和描述。

3.AI資產泡沫的問題,AI必須為用戶解決重要復雜的問題才能有價值,但現(xiàn)在它的發(fā)展成效,遠遠不能和互聯(lián)網(wǎng)等技術當年初生時的情況相比

Benchmark合伙人Michael Eisenberg在最近的一期訪談中,引用了其好友Atreides Management創(chuàng)始人Gavin Baker關于大模型發(fā)展的觀點:“基礎模型是歷史上貶值最快的資產。”

他所舉的例子來自Seeking Alpha的創(chuàng)始人,類似金融領域這種每分鐘都會進行業(yè)務和數(shù)據(jù)更新的高頻領域,訓練出來的模型只能完成寫報告之類的常規(guī)工作,但無法應對數(shù)據(jù)的高速刷新,滿足金融預測未來的需求。

而且,其他技術的發(fā)展是確定性的,互聯(lián)網(wǎng)發(fā)展早期雖然泡沫巨大,但已經體現(xiàn)了應用路徑;而AI渾身都是不確定性。互聯(lián)網(wǎng)發(fā)展的邊際成本幾乎約等于0(或者說其中不少都分擔給了運營商和用戶),然而AI成長的邊際成本涉及大量固定資產,現(xiàn)在都由創(chuàng)業(yè)者自己承擔,而且越投入邊際改善效應越弱。大量的早期投入,很可能是一個陷阱。

技術革命之后必須伴隨產業(yè)革命,產業(yè)革命則需要現(xiàn)象級產品的引領。AI更需要的是一個成功的場景。目前看來,AI-generated Video還沒有拿到這類成果的起色。

Perplexity的創(chuàng)始人Arin對此提供了另外一個觀點,那就是基礎模型的價值本質映射著背后團隊的價值,即Sora之于OpenAI,文心大模型之于百度。不是Sora能革了視頻的命,只是外界相信由OpenAI領導的Sora具備這樣的可能性而已。當Sora沒能提供符合我們預期的突破時,誰能在這個領域擔起大任呢?

由此出發(fā),關鍵或許在于誰能先把AI-generated Video真正融入到某一個商業(yè)系統(tǒng)的工作流中去,就像Clapper對視頻制作的探索一樣。而這就是一個更大的問題了,因為它涉及到和其他領域的融合——氣象、城市、影視、汽車、制造業(yè)。也許Sora會在今年的某天拿出一個更具體的成果,也許是其他的創(chuàng)業(yè)公司顛覆了我們對AI視頻的認知。

來源:松果財經

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關標簽
ai智能

相關文章

  • Figma股價熱情僅存1天,AI焦慮成關鍵隱憂?

    文/道哥美國設計軟件公司Figma近期在紐約證券交易所掛牌上市,首日即上演“狂飆”行情——發(fā)行價定每股33美元,開盤報價85美元,較發(fā)行價翻倍。首日收報115.50美元,較發(fā)行價大漲約250%,市值飆升至近670億美元,創(chuàng)下近30年來同等規(guī)模美股IPO的最大單日漲幅紀錄。然而,隨著短線資金獲利了結,

    標簽:
    ai智能
  • AI「帶飛」騰訊業(yè)績

    文/一燈來源/節(jié)點財經在當前無人敢缺席的AI軍備競賽中,巨頭們一面為巨額的資本支出焦慮,一面又向市場勾勒著未來的宏偉藍圖。在各家動輒千億級投入的背景下,市場迫切需要一份關于AI回報價值的有力證明。而騰訊,率先給出了答卷。8月13日,騰訊控股發(fā)布2025年第二季度財報。盡管資本開支同比劇增119%,達

    標簽:
    ai智能
    騰訊
  • Meta用億元薪酬發(fā)起「人才狙擊」能否買來一個AI未來?

    文/二風來源/節(jié)點財經2025年的硅谷,一場沒有硝煙的戰(zhàn)爭正以前所未有的烈度上演。這場戰(zhàn)爭的核心武器不是代碼或芯片,而是人——那些全球僅有數(shù)千名、能夠構建未來人工智能基礎模型的頂尖大腦。在這場激烈的人才爭奪戰(zhàn)中,Meta及其首席執(zhí)行官馬克·扎克伯格(MarkZuckerberg)正扮演著最具侵略性的

    標簽:
    ai智能
  • 騰訊AI夢:克制的雄心

    關乎14億用戶的深刻變化

    標簽:
    ai智能
  • Manus「撤出」中國,昔日AI Agent新星為何倉促離場?

    文/道哥大舉裁員、清空賬號、國內IP無法訪問——曾被譽為“中國AIAgent希望之星”的Manus,在估值飆至5億美元的高光時刻“閃離”中國市場。近日,Manus“裁員、出走”的消息在媒體端大量發(fā)酵。消息稱,Manus公司總部將由中國遷至新加坡,其國內團隊也將大幅裁撤——原有120人規(guī)模團隊除40余

    標簽:
    ai智能
  • 20%員工或被裁、1.6萬人離開:Meta醞釀史上最大規(guī)模裁員

    文/楊雪健來源/節(jié)點財經Meta或迎來史上最大規(guī)模裁員潮。2026年3月14日,路透社曝出Meta正計劃啟動新一輪大規(guī)模裁員,此次裁員比例或達公司總員工數(shù)的20%,按其近7.9萬的員工規(guī)模計算,約1.58萬名員工或將被裁。若該計劃執(zhí)行,將成為Meta自2022年底實行“效率之年”重組后規(guī)模最大的一次

  • 阿里發(fā)布全球首個企業(yè)級Agent平臺“悟空”

    3月17日,阿里發(fā)布全球首個企業(yè)級AI原生工作平臺——“悟空”,讓每個團隊、每家公司,都能擁有一支24h工作的”龍蝦軍團”。悟空是一款獨立應用,即日起開啟邀測,也將直接內置到超2000萬企業(yè)組織的釘釘之中。擁有8億用戶的釘釘重寫底層代碼,進行全面CLI(命令行界面)化改造,讓悟空Agent能夠原生操

  • 90%的AI中間商會消失:Google封號只是第一槍

    AI的“免費紅利期”結束了,未來18個月,靠“API倒賣”的公司,會成片消失。這個導火索就是最近Google的一輪封號導致的,隨著封號風波的結束,這也標志著AI行業(yè)【收租時代】來了。2月封號潮:高付費用戶被一鍋端一周前,Google開始大規(guī)模封號,付著250美金月費的人,賬號說沒就沒,Gmail、Y

  • DeepSeek V4意外泄露,原生多模態(tài)

    來自路透社等媒體報道的最新消息:DeepSeek未發(fā)布的V4Lite模型遭泄露上網(wǎng),華為獲得早期訪問權限,英偉達被排除在外。近期,谷歌發(fā)表了2篇Multi-Agent協(xié)作學習新論文有網(wǎng)友提供了更加詳細的信息,DeepSeekV4Lite:100萬token上下文窗口(V3為128K)內置原生多模態(tài)推

  • 中國開啟AI全民化元年,BAT同入“億級俱樂部”

    春節(jié)紅包會結束,但AI已融入數(shù)億人生活里

  • 開源模型再突破,全球AI行業(yè)的拐點要來了?

    性能、商業(yè)、生態(tài)詮釋開源模型的最佳姿態(tài)

  • 看懂黃仁勛CES演講,就看懂 AI 接下來十年的走向

    2026年剛開年,全世界最狂的那個男人,穿著他的經典黑皮衣,在CES舞臺上發(fā)出了未來十年的信號。他搞了個“能吃飽套餐”:6個包子+一碟小菜+一碗粥=肉包子套餐,這樣以后你只要買一個套餐就能吃飽了。(Rubin平臺)同時他們店里還免費提供的筷子、勺子、蘸料、醬油、醋、水果、零食等等。(開放10萬億語言

  • GDPS2025賽場直擊!開普勒大黃蜂助力華理斬獲搬運賽項桂冠

    12月12日-14日,2025全球開發(fā)者先鋒大會暨國際具身智能技能大賽(GDPS2025)于上海張江科學會堂舉行,大會以具身智能競技為核心,融合了技術比拼、產業(yè)展示與科普體驗,為全球觀眾呈現(xiàn)出具身智能的現(xiàn)在與未來。上海開普勒機器人有限公司(以下簡稱"開普勒機器人")攜明星產品K2"大黃蜂"亮相,并參

    標簽:
    GDPS
    2025
  • 弈動 Dynamic·數(shù)智躍遷 博弈無界|2025TechWorld智慧安全大會在京召開

    在數(shù)字化與智能化深度交織的時代浪潮中,安全的邊界不斷延展,技術的演進正引領產業(yè)邁向新一輪變革。10月24日,以“弈動Dynamic·數(shù)智躍遷博弈無界”為主題的2025TechWorld智慧安全大會在北京盛大召開。來自國家部委、院士學者、高校科研機構和企業(yè)的權威專家與業(yè)界精英齊聚北京,共議AI安全、數(shù)

    標簽:
    弈動
  • 甌江論道:AI賦能綠色發(fā)展

    2025年10月25日,2025世界青年科學家峰會之人工智能(AI)融合創(chuàng)新發(fā)展論壇在浙江溫州成功舉辦。本次論壇由國際院士科創(chuàng)中心主辦,中國投資協(xié)會能源投資專業(yè)委員會、溫港院士科創(chuàng)中心承辦,中國電工技術學會、中科先進技術溫州研究院與溫州市電力工程學會提供支持,以“甌江論道-AI賦能綠色發(fā)展”為主題,

    標簽:
    ai技術

編輯推薦