1. 創(chuàng)業(yè)頭條
  2. 前沿領域
  3. AI智能
  4. 正文

2025年10個頂級GPU云平臺:Serverless+RL開啟AI普惠時代

 2025-06-24 17:42  來源:  我來投稿 撤稿糾錯

  一鍵部署OpenClaw

近期,“AI新云”(NeoCloud)概念在科技圈和投資圈引發(fā)熱潮。

今年3月,被業(yè)內稱作“英偉達親兒子”的AI基礎設施企業(yè)CoreWeave上市。這家依托英偉達GPU資源沖擊新云市場的初創(chuàng)公司,上市不到3個月市值飆升359%,達881億美元。

CoreWeave的“身價暴漲”吸引了無數視線。對此,不少業(yè)內人士指出,大模型的訓練和推理應用都異常燒錢,高昂成本已是大模型規(guī)模化應用的關鍵挑戰(zhàn)之一。在此背景下,被稱為AI新云的GPU專用云服務平臺迅速崛起。相較通用云服務,此類平臺更能精準解決AI真實場景落地的痛點。

2025年上半年的的產業(yè)圖景印證了這一趨勢。主流云平臺擁抱“無服務器架構(Serverless)+強化學習(RL)”的技術棧,不僅解決了傳統(tǒng)算力成本高企的行業(yè)痛點,更推動多模態(tài)創(chuàng)作、機器人訓練等場景效率實現指數級提升。

毫無疑問,這場由底層計算框架驅動的智能進化,為智能體邊界的拓展按下了快進鍵。全球GPU云市場正在醞釀新的產業(yè)造富故事。

Serverless+RL,智算云按下AI應用“快進鍵”

今年,“DeepSeek時刻”震驚全球,大模型廠商紛紛加速模型迭代,智能體大規(guī)模部署應用的元年開啟。而在全球智能體掘金熱潮中,提供底層算力的AI新云悄然成為最重要的“賣水人”。

自2013年起便深耕中國人工智能基礎設施領域,有著豐富行業(yè)經驗的九章云極董事長方磊指出,“從移動互聯(lián)網‘帶寬式應用’到AI時代‘計算密集型應用’的結構性變革,亟需新型云架構支撐。”

海外市場,以CoreWeave為代表,包括Crusoe、Lambda Labs等AI基礎設施服務商正加速擴張。而國內同樣參與者眾多,比如2025年第二季度,阿里云、九章云極等企業(yè)先后發(fā)布新一代AI基礎設施服務,如阿里云的FlashMoE和九章云極基于Serverless+RL架構的九章智算云Alaya NeW Cloud。

AI基礎設施廠商快速發(fā)展的背后,是企業(yè)正在加速部署AI規(guī)?;瘧谩S袡C構認為,AI常因高昂的算力成本和復雜的部署被視為“極客的游戲”,而非企業(yè)的“生產工具”,但隨著GPU云的快速普及,讓AI快速成為企業(yè)的一個“新生產力”。

聚焦AI云計算和基礎設施建設的廠商開始探索各種新技術路線,解決AI應用落地的痛點。

在此背景下,“Serverless+RL”技術組合逐漸脫穎而出。這兩項技術并非全新概念,但它們的深度融合正悄然改寫智能應用的開發(fā)邏輯,并重塑AI產業(yè)的成本結構與創(chuàng)新效率。

Serverless的核心價值在于“按需使用、按量付費”。企業(yè)無需預置服務器,只需關注業(yè)務邏輯,云服務商會自動完成資源分配。而強化學習(RL)則是一種通過“試錯-反饋”機制優(yōu)化決策的算法,推動智能體能力從“對話問答”(聽話)向“任務執(zhí)行”(聰明)躍遷。

強化學習的核心價值在于,讓AI從人類反饋中學習。這樣做的好處是,不僅可以調優(yōu)推理行為,還實質性的增強模型的推理能力,讓模型聽話,也可以讓模型更聰明。

這意味著企業(yè)能以更低的成本、更快的速度迭代智能應用,加速AI技術的落地,引發(fā)從“參數競賽”到“場景落地”的產業(yè)轉向。因此,Serverless+RL的融合不僅是技術層面的進步,更是AI產業(yè)商業(yè)化的加速器。

從“技術炫技”到“商業(yè)落地”,也必然帶來新一輪產業(yè)發(fā)展的紅利,全球GPU云廠商正站在關鍵拐點。在這場變革中,誰能率先掌握技術融合的紅利,誰就能在未來的競爭中占據先機。

智能時代加速演進,三大趨勢揭示技術紅利

2025年上半年,技術降本和創(chuàng)新效率成為人工智能、機器人產業(yè)發(fā)展的關鍵詞,也正因此,Serverless與RL兩大技術路線的組合受到了業(yè)界廣泛的關注,有望成為推動智能體商業(yè)化爆發(fā)的重要技術路線。我們從GPU云廠商、大模型公司和機器人等多個領域觀察到這一趨勢。

關鍵趨勢一:GPU云廠商加速技術降本和AI開發(fā)服務升級

1、九章云極:發(fā)布九章智算云Alaya NeW Cloud 2.0,開創(chuàng)中國Serverless+RL技術路線。

6月16日,作為國家算力互聯(lián)網試驗網建設的重要成員,AI獨角獸九章云極DataCanvas發(fā)布了新一代全棧智能計算云平臺——九章智算云Alaya NeW Cloud 2.0,并同步啟動全球首個強化學習智算服務,為中國近百萬的AI應用開發(fā)者和科研機構提供普惠性智算云服務。

該平臺深度融合Serverless架構與強化學習技術,實現子算成本革新:獨創(chuàng)“1度算力”按實際消耗計費模型,顯著降低使用門檻。實測顯示,其多模態(tài)訓練推理成本僅為行業(yè)均值40%,多場景拍攝效率提升35%,虛擬場景制作耗時從2小時減少至20分鐘,動畫電影制作成本降低60%。

相比海外以CoreWeave為代表的資源型企業(yè),九章云極展現出中國廠商更關注技術“用處”的不同思路。九章智算云Alaya NeW Cloud 2.0集成了豐富的AI開發(fā)框架和工具,如TensorFlow、PyTorch等,支持多種編程語言,方便開發(fā)者快速構建和訓練AI模型。

與海外平臺圍繞資源布局不同,九章云極增加AI技術權重,圍繞智能計算中心算力調度這一國際頂尖能力,連續(xù)突破AIDC智能體的技術門檻,形成算力調度智能技術專利護城河——本季內,九章云極先后發(fā)布了“智能體調試智能體方法”、“大模型函數調用優(yōu)化方法“、”生成多智能體協(xié)作系統(tǒng)方法“、”智能體開發(fā)工具函數方法“等多個專利,發(fā)布“國內首個智算調度Agent“。

2、CoreWeave:成為ClusterMAX™評級體系鉑金級GPU云服務商

CoreWeave整體用戶體驗和性能表現優(yōu)秀,已達到ClusterMAX™評級體系的鉑金標準。CoreWeave技術路線深度綁定NVIDIA生態(tài),在AI訓練領域具備先發(fā)優(yōu)勢,是AI算力基礎設施領域的專業(yè)化服務商代表之一。

3、Lambda Labs:完成D輪融資,成本與客戶體驗是GPU云平臺關鍵方向

Lambda labs,宣布成功完成了4.8億美元的D輪融資,使其總股本達到了8.63億美元。據悉,此次融資由Andra Capital和SGW共同主導,NVIDIA、ARK Invest等投資者參與其中。

據Lambda Labs聯(lián)合創(chuàng)始人兼首席執(zhí)行官,Stephen Balaban自述,因為AWS 的GPU 云實例極其昂貴,Lambda Labs決定自己組建GPU 服務器集群,然后為客戶提供更具性價比的解決方案。

此外,Lambda正在積極開發(fā)托管Slurm服務,這將大幅提升客戶體驗。

4、Google Cloud:Next 25大會上發(fā)表多項AI創(chuàng)新,成本性能雙突破

Google Cloud 通過提供搭載 NVIDIA B200 和 GB200 GPU 的 A4 和 A4X 虛擬機,為客戶提供更多 AI 硬件選擇。Google 也將成為首家提供 NVIDIA 新一代 Vera Rubin GPU 的云提供商。

Cloud Wide Area Network(Cloud WAN)針對應用程序性能進行優(yōu)化,可提供超過40%的性能提升,同時降低高達40%的總體持有成本。

趨勢一小結:無疑,成本和開發(fā)者體驗成為云GPU廠商競爭的兩大價值錨點,而Serverless+RL的優(yōu)勢凸顯,有望成為AI新云發(fā)展的核心技術驅動力。

關鍵趨勢二:大模型部署與推理應用聚焦成本

1、聚焦云上部署Deepseek,國內云廠商大幅降低部署成本。

DeepSeek-R1的問世讓低成本的模型訓練變得可行。方磊就此提出,能否為數千萬開發(fā)者提供普惠算力服務,將成為決定AI云企業(yè)競爭力的重要考核維度。

然而,以DeepSeek-R1大模型來看,權重顯存達700GB,需16張96GB顯存GPU多機部署,依然面臨高昂硬件成本與跨機傳輸效率挑戰(zhàn),云端部署方案破解瓶頸勢在必行。

近期,國內科技巨頭紛紛針對DeepSeek云上部署作出優(yōu)化。比如,阿里云支持一鍵部署DeepSeek系列模型,提供彈性算力與自定義環(huán)境,按需付費模式大幅降低硬件投入;九章智算云結合Serverless與強化學習(RL)技術復現DeepSeek- R全參數微調,在 AIME 2024 基準上取得了81.70%準確率(采樣),超越了DeepSeek-R1滿血版,部署成本降至40%。

這些信息說明。AI普惠的進程在GPU云廠商推動下正在持續(xù)加速。

2、OpenAI:模型加速迭代,成本持續(xù)優(yōu)化。

再看大模型廠商,同樣在迭代大模型能力的同時,持續(xù)改進降本。比如,近期OpenAI新上線的o3-pro不僅有更強的能力,可以訪問一系列工具,包括網頁瀏覽、文件分析、視覺推理、基于內存的個性化響應等,更有更低的花費,輸入的價格為20美元100萬tokens,輸出則是80美元100萬tokens,較這一模型所取代的o1-pro降低了87%。100萬tokens相當于75萬個單詞。

趨勢二小結:隨著模型使用成本持續(xù)優(yōu)化,AI Agent將爆發(fā)式發(fā)展,帶來更多算力需求,GPU云廠商將從中受益。

關鍵趨勢三:Serverless+強化學習成機器人產業(yè)“關鍵技術”

1、宇樹科技:強化學習代碼全面開源。

宇樹科技開源培訓訓練了其機器人訓練的所有源代碼包括了強化學習(RL)代碼、從模擬到模擬(Sim-to-Sim)和從模擬到現實(Sim-to-Real)的源代碼。該項目可以幫助開發(fā)者或研究人員在虛擬環(huán)境中模擬和機器人,然后把結果轉移到機器人上。既降低試錯成本,又保障訓練安全。

2、特斯拉擎天柱:完全通過強化學習(RL)在模擬環(huán)境中訓練。

特斯拉公布了機器人擎天柱的訓練方式:用強化學習(RL)+模擬器來機器人的方法,讓擎天柱看互聯(lián)網上的視頻,學動作,然后在模擬器里,用強化學習提升可靠性。擎天柱的發(fā)展已經進入快車道,未來的進步速度很可能會非常嚇人。

總結:強化學習(RL)已深度融入生成式AI的對齊優(yōu)化與機器人自主進化流程,而Serverless架構則通過重塑資源供給模式,為智能體提供彈性算力基座。未來,Serverless+RL有望成為驅動智能體規(guī)模化落地的核心技術路線。

結語

Serverless與強化學習(RL)的技術組合正在讓AI開發(fā)從“參數競賽”變成“場景落地”,新的投資機會正在涌現。

歷史經驗表明,最具商業(yè)價值的企業(yè),往往通過重塑客戶成本結構實現爆發(fā)式增長。

不像想象,GPU云平臺在新的技術路線加持下,將激發(fā)指數級增長的智能場景需求,成為智能體時代的超級潛力股。

來源:美股研究社

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關標簽
ai智能

相關文章

  • Figma股價熱情僅存1天,AI焦慮成關鍵隱憂?

    文/道哥美國設計軟件公司Figma近期在紐約證券交易所掛牌上市,首日即上演“狂飆”行情——發(fā)行價定每股33美元,開盤報價85美元,較發(fā)行價翻倍。首日收報115.50美元,較發(fā)行價大漲約250%,市值飆升至近670億美元,創(chuàng)下近30年來同等規(guī)模美股IPO的最大單日漲幅紀錄。然而,隨著短線資金獲利了結,

    標簽:
    ai智能
  • AI「帶飛」騰訊業(yè)績

    文/一燈來源/節(jié)點財經在當前無人敢缺席的AI軍備競賽中,巨頭們一面為巨額的資本支出焦慮,一面又向市場勾勒著未來的宏偉藍圖。在各家動輒千億級投入的背景下,市場迫切需要一份關于AI回報價值的有力證明。而騰訊,率先給出了答卷。8月13日,騰訊控股發(fā)布2025年第二季度財報。盡管資本開支同比劇增119%,達

    標簽:
    ai智能
    騰訊
  • Meta用億元薪酬發(fā)起「人才狙擊」能否買來一個AI未來?

    文/二風來源/節(jié)點財經2025年的硅谷,一場沒有硝煙的戰(zhàn)爭正以前所未有的烈度上演。這場戰(zhàn)爭的核心武器不是代碼或芯片,而是人——那些全球僅有數千名、能夠構建未來人工智能基礎模型的頂尖大腦。在這場激烈的人才爭奪戰(zhàn)中,Meta及其首席執(zhí)行官馬克·扎克伯格(MarkZuckerberg)正扮演著最具侵略性的

    標簽:
    ai智能
  • 騰訊AI夢:克制的雄心

    關乎14億用戶的深刻變化

    標簽:
    ai智能
  • Manus「撤出」中國,昔日AI Agent新星為何倉促離場?

    文/道哥大舉裁員、清空賬號、國內IP無法訪問——曾被譽為“中國AIAgent希望之星”的Manus,在估值飆至5億美元的高光時刻“閃離”中國市場。近日,Manus“裁員、出走”的消息在媒體端大量發(fā)酵。消息稱,Manus公司總部將由中國遷至新加坡,其國內團隊也將大幅裁撤——原有120人規(guī)模團隊除40余

    標簽:
    ai智能

編輯推薦