1. 創(chuàng)業(yè)頭條
  2. 前沿領域
  3. AI智能
  4. 正文

2025年10個頂級GPU云平臺:Serverless+RL開啟AI普惠時代

 2025-06-24 17:42  來源:  我來投稿 撤稿糾錯

  阿里云優(yōu)惠券 先領券再下單

近期,“AI新云”(NeoCloud)概念在科技圈和投資圈引發(fā)熱潮。

今年3月,被業(yè)內稱作“英偉達親兒子”的AI基礎設施企業(yè)CoreWeave上市。這家依托英偉達GPU資源沖擊新云市場的初創(chuàng)公司,上市不到3個月市值飆升359%,達881億美元。

CoreWeave的“身價暴漲”吸引了無數(shù)視線。對此,不少業(yè)內人士指出,大模型的訓練和推理應用都異常燒錢,高昂成本已是大模型規(guī)模化應用的關鍵挑戰(zhàn)之一。在此背景下,被稱為AI新云的GPU專用云服務平臺迅速崛起。相較通用云服務,此類平臺更能精準解決AI真實場景落地的痛點。

2025年上半年的的產業(yè)圖景印證了這一趨勢。主流云平臺擁抱“無服務器架構(Serverless)+強化學習(RL)”的技術棧,不僅解決了傳統(tǒng)算力成本高企的行業(yè)痛點,更推動多模態(tài)創(chuàng)作、機器人訓練等場景效率實現(xiàn)指數(shù)級提升。

毫無疑問,這場由底層計算框架驅動的智能進化,為智能體邊界的拓展按下了快進鍵。全球GPU云市場正在醞釀新的產業(yè)造富故事。

Serverless+RL,智算云按下AI應用“快進鍵”

今年,“DeepSeek時刻”震驚全球,大模型廠商紛紛加速模型迭代,智能體大規(guī)模部署應用的元年開啟。而在全球智能體掘金熱潮中,提供底層算力的AI新云悄然成為最重要的“賣水人”。

自2013年起便深耕中國人工智能基礎設施領域,有著豐富行業(yè)經驗的九章云極董事長方磊指出,“從移動互聯(lián)網‘帶寬式應用’到AI時代‘計算密集型應用’的結構性變革,亟需新型云架構支撐。”

海外市場,以CoreWeave為代表,包括Crusoe、Lambda Labs等AI基礎設施服務商正加速擴張。而國內同樣參與者眾多,比如2025年第二季度,阿里云、九章云極等企業(yè)先后發(fā)布新一代AI基礎設施服務,如阿里云的FlashMoE和九章云極基于Serverless+RL架構的九章智算云Alaya NeW Cloud。

AI基礎設施廠商快速發(fā)展的背后,是企業(yè)正在加速部署AI規(guī)?;瘧?。有機構認為,AI常因高昂的算力成本和復雜的部署被視為“極客的游戲”,而非企業(yè)的“生產工具”,但隨著GPU云的快速普及,讓AI快速成為企業(yè)的一個“新生產力”。

聚焦AI云計算和基礎設施建設的廠商開始探索各種新技術路線,解決AI應用落地的痛點。

在此背景下,“Serverless+RL”技術組合逐漸脫穎而出。這兩項技術并非全新概念,但它們的深度融合正悄然改寫智能應用的開發(fā)邏輯,并重塑AI產業(yè)的成本結構與創(chuàng)新效率。

Serverless的核心價值在于“按需使用、按量付費”。企業(yè)無需預置服務器,只需關注業(yè)務邏輯,云服務商會自動完成資源分配。而強化學習(RL)則是一種通過“試錯-反饋”機制優(yōu)化決策的算法,推動智能體能力從“對話問答”(聽話)向“任務執(zhí)行”(聰明)躍遷。

強化學習的核心價值在于,讓AI從人類反饋中學習。這樣做的好處是,不僅可以調優(yōu)推理行為,還實質性的增強模型的推理能力,讓模型聽話,也可以讓模型更聰明。

這意味著企業(yè)能以更低的成本、更快的速度迭代智能應用,加速AI技術的落地,引發(fā)從“參數(shù)競賽”到“場景落地”的產業(yè)轉向。因此,Serverless+RL的融合不僅是技術層面的進步,更是AI產業(yè)商業(yè)化的加速器。

從“技術炫技”到“商業(yè)落地”,也必然帶來新一輪產業(yè)發(fā)展的紅利,全球GPU云廠商正站在關鍵拐點。在這場變革中,誰能率先掌握技術融合的紅利,誰就能在未來的競爭中占據(jù)先機。

智能時代加速演進,三大趨勢揭示技術紅利

2025年上半年,技術降本和創(chuàng)新效率成為人工智能、機器人產業(yè)發(fā)展的關鍵詞,也正因此,Serverless與RL兩大技術路線的組合受到了業(yè)界廣泛的關注,有望成為推動智能體商業(yè)化爆發(fā)的重要技術路線。我們從GPU云廠商、大模型公司和機器人等多個領域觀察到這一趨勢。

關鍵趨勢一:GPU云廠商加速技術降本和AI開發(fā)服務升級

1、九章云極:發(fā)布九章智算云Alaya NeW Cloud 2.0,開創(chuàng)中國Serverless+RL技術路線。

6月16日,作為國家算力互聯(lián)網試驗網建設的重要成員,AI獨角獸九章云極DataCanvas發(fā)布了新一代全棧智能計算云平臺——九章智算云Alaya NeW Cloud 2.0,并同步啟動全球首個強化學習智算服務,為中國近百萬的AI應用開發(fā)者和科研機構提供普惠性智算云服務。

該平臺深度融合Serverless架構與強化學習技術,實現(xiàn)子算成本革新:獨創(chuàng)“1度算力”按實際消耗計費模型,顯著降低使用門檻。實測顯示,其多模態(tài)訓練推理成本僅為行業(yè)均值40%,多場景拍攝效率提升35%,虛擬場景制作耗時從2小時減少至20分鐘,動畫電影制作成本降低60%。

相比海外以CoreWeave為代表的資源型企業(yè),九章云極展現(xiàn)出中國廠商更關注技術“用處”的不同思路。九章智算云Alaya NeW Cloud 2.0集成了豐富的AI開發(fā)框架和工具,如TensorFlow、PyTorch等,支持多種編程語言,方便開發(fā)者快速構建和訓練AI模型。

與海外平臺圍繞資源布局不同,九章云極增加AI技術權重,圍繞智能計算中心算力調度這一國際頂尖能力,連續(xù)突破AIDC智能體的技術門檻,形成算力調度智能技術專利護城河——本季內,九章云極先后發(fā)布了“智能體調試智能體方法”、“大模型函數(shù)調用優(yōu)化方法“、”生成多智能體協(xié)作系統(tǒng)方法“、”智能體開發(fā)工具函數(shù)方法“等多個專利,發(fā)布“國內首個智算調度Agent“。

2、CoreWeave:成為ClusterMAX™評級體系鉑金級GPU云服務商

CoreWeave整體用戶體驗和性能表現(xiàn)優(yōu)秀,已達到ClusterMAX™評級體系的鉑金標準。CoreWeave技術路線深度綁定NVIDIA生態(tài),在AI訓練領域具備先發(fā)優(yōu)勢,是AI算力基礎設施領域的專業(yè)化服務商代表之一。

3、Lambda Labs:完成D輪融資,成本與客戶體驗是GPU云平臺關鍵方向

Lambda labs,宣布成功完成了4.8億美元的D輪融資,使其總股本達到了8.63億美元。據(jù)悉,此次融資由Andra Capital和SGW共同主導,NVIDIA、ARK Invest等投資者參與其中。

據(jù)Lambda Labs聯(lián)合創(chuàng)始人兼首席執(zhí)行官,Stephen Balaban自述,因為AWS 的GPU 云實例極其昂貴,Lambda Labs決定自己組建GPU 服務器集群,然后為客戶提供更具性價比的解決方案。

此外,Lambda正在積極開發(fā)托管Slurm服務,這將大幅提升客戶體驗。

4、Google Cloud:Next 25大會上發(fā)表多項AI創(chuàng)新,成本性能雙突破

Google Cloud 通過提供搭載 NVIDIA B200 和 GB200 GPU 的 A4 和 A4X 虛擬機,為客戶提供更多 AI 硬件選擇。Google 也將成為首家提供 NVIDIA 新一代 Vera Rubin GPU 的云提供商。

Cloud Wide Area Network(Cloud WAN)針對應用程序性能進行優(yōu)化,可提供超過40%的性能提升,同時降低高達40%的總體持有成本。

趨勢一小結:無疑,成本和開發(fā)者體驗成為云GPU廠商競爭的兩大價值錨點,而Serverless+RL的優(yōu)勢凸顯,有望成為AI新云發(fā)展的核心技術驅動力。

關鍵趨勢二:大模型部署與推理應用聚焦成本

1、聚焦云上部署Deepseek,國內云廠商大幅降低部署成本。

DeepSeek-R1的問世讓低成本的模型訓練變得可行。方磊就此提出,能否為數(shù)千萬開發(fā)者提供普惠算力服務,將成為決定AI云企業(yè)競爭力的重要考核維度。

然而,以DeepSeek-R1大模型來看,權重顯存達700GB,需16張96GB顯存GPU多機部署,依然面臨高昂硬件成本與跨機傳輸效率挑戰(zhàn),云端部署方案破解瓶頸勢在必行。

近期,國內科技巨頭紛紛針對DeepSeek云上部署作出優(yōu)化。比如,阿里云支持一鍵部署DeepSeek系列模型,提供彈性算力與自定義環(huán)境,按需付費模式大幅降低硬件投入;九章智算云結合Serverless與強化學習(RL)技術復現(xiàn)DeepSeek- R全參數(shù)微調,在 AIME 2024 基準上取得了81.70%準確率(采樣),超越了DeepSeek-R1滿血版,部署成本降至40%。

這些信息說明。AI普惠的進程在GPU云廠商推動下正在持續(xù)加速。

2、OpenAI:模型加速迭代,成本持續(xù)優(yōu)化。

再看大模型廠商,同樣在迭代大模型能力的同時,持續(xù)改進降本。比如,近期OpenAI新上線的o3-pro不僅有更強的能力,可以訪問一系列工具,包括網頁瀏覽、文件分析、視覺推理、基于內存的個性化響應等,更有更低的花費,輸入的價格為20美元100萬tokens,輸出則是80美元100萬tokens,較這一模型所取代的o1-pro降低了87%。100萬tokens相當于75萬個單詞。

趨勢二小結:隨著模型使用成本持續(xù)優(yōu)化,AI Agent將爆發(fā)式發(fā)展,帶來更多算力需求,GPU云廠商將從中受益。

關鍵趨勢三:Serverless+強化學習成機器人產業(yè)“關鍵技術”

1、宇樹科技:強化學習代碼全面開源。

宇樹科技開源培訓訓練了其機器人訓練的所有源代碼包括了強化學習(RL)代碼、從模擬到模擬(Sim-to-Sim)和從模擬到現(xiàn)實(Sim-to-Real)的源代碼。該項目可以幫助開發(fā)者或研究人員在虛擬環(huán)境中模擬和機器人,然后把結果轉移到機器人上。既降低試錯成本,又保障訓練安全。

2、特斯拉擎天柱:完全通過強化學習(RL)在模擬環(huán)境中訓練。

特斯拉公布了機器人擎天柱的訓練方式:用強化學習(RL)+模擬器來機器人的方法,讓擎天柱看互聯(lián)網上的視頻,學動作,然后在模擬器里,用強化學習提升可靠性。擎天柱的發(fā)展已經進入快車道,未來的進步速度很可能會非常嚇人。

總結:強化學習(RL)已深度融入生成式AI的對齊優(yōu)化與機器人自主進化流程,而Serverless架構則通過重塑資源供給模式,為智能體提供彈性算力基座。未來,Serverless+RL有望成為驅動智能體規(guī)?;涞氐暮诵募夹g路線。

結語

Serverless與強化學習(RL)的技術組合正在讓AI開發(fā)從“參數(shù)競賽”變成“場景落地”,新的投資機會正在涌現(xiàn)。

歷史經驗表明,最具商業(yè)價值的企業(yè),往往通過重塑客戶成本結構實現(xiàn)爆發(fā)式增長。

不像想象,GPU云平臺在新的技術路線加持下,將激發(fā)指數(shù)級增長的智能場景需求,成為智能體時代的超級潛力股。

來源:美股研究社

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關標簽
ai智能

相關文章

  • 阿里巴巴梭哈AI

    2024年往前數(shù)三年,我們稱之為阿里巴巴失去的三年。

  • 全球AI巨頭正在賭:誰搞定MCP,誰就是未來老大

    我不是危言聳聽,現(xiàn)在全球的AI巨頭都在做MCP,毫不夸張的說:誰能把MCP做起來,誰就擁有AI生態(tài)控制權,誰就是AI圈的老大。你們有沒有發(fā)現(xiàn),MCP在2025年初開始特別火爆,互聯(lián)網技術大廠都在強推MCP。(1)阿里云百煉搞了個MCP平臺,提供50+預置MCP服務。不過大都只面向阿里系產品。(2)騰

    標簽:
    ai智能
  • 本以為DeepSeek天下無敵了,沒想到Manus更猛

    昨天新出了一個AI,據(jù)說比DeepSeek還牛,而截止到今早,已經有10萬人在排隊申請Manus邀請碼了,而且它邀請碼已經炒到10萬了。這是北京的一家人工智能公司蝴蝶科技,創(chuàng)始人是一名來自華中科技大學的90后畢業(yè)生肖弘,突然向全球宣布:世界上第一款真正的人工智能、通用智能體產品出現(xiàn)了,名叫Manus

    標簽:
    ai智能
  • AI加速時代的“進度條”,我們撥動了百分之幾?

    “技術日新月異,人類生活方式正在快速轉變,這一切給人類歷史帶來了一系列不可思議的奇點。我們曾經熟悉的一切,都開始變得陌生。”計算機之父約翰·馮·諾依曼曾這樣說到。

    標簽:
    ai智能
  • AI視頻賽道,要變天了

    “毀滅你,與你何干?”,這是在劉慈欣的科幻小說《三體》里用來形容人類與三體人之間的戰(zhàn)爭的一句話。

    標簽:
    ai智能
  • 2025年10個頂級GPU云平臺:Serverless+RL開啟AI普惠時代

    近期,“AI新云”(NeoCloud)概念在科技圈和投資圈引發(fā)熱潮。今年3月,被業(yè)內稱作“英偉達親兒子”的AI基礎設施企業(yè)CoreWeave上市。這家依托英偉達GPU資源沖擊新云市場的初創(chuàng)公司,上市不到3個月市值飆升359%,達881億美元。CoreWeave的“身價暴漲”吸引了無數(shù)視線。對此,不少

    標簽:
    ai智能
  • 阿里巴巴梭哈AI

    2024年往前數(shù)三年,我們稱之為阿里巴巴失去的三年。

  • 華為盤古大模型5.5發(fā)布:深度思考模型將上線

    一場人工智能領域的革新風暴正從華為開發(fā)者大會現(xiàn)場席卷全球產業(yè)界。2025年6月20日,在東莞舉行的華為開發(fā)者大會HDC2025上,華為常務董事、華為云計算CEO張平安揭開了盤古大模型5.5的神秘面紗。這一全新版本在自然語言處理、計算機視覺、多模態(tài)、預測和科學計算五大基礎模型上實現(xiàn)全面突破,標志著中國

  • OpenAI 推出開源客戶服務代理框架 支持商業(yè)或實驗用途

    一行代碼未寫,企業(yè)已獲完整客服系統(tǒng)——這將是AI代理普及的新起點?!敖裉鞓酥局鳤I代理技術從實驗室走向產業(yè)的轉折點?!監(jiān)penAI產品負責人OlivierGodement在項目發(fā)布聲明中如此評價。就在今日,這家AI巨頭通過HuggingFace平臺開源了一套完整的客戶服務代理框架,采用寬松的MIT許

    標簽:
    ai技術
  • 夸克App上線“夸克老師”:AI實現(xiàn)個性化輔導,精準攻克學習難題

    6月17日,阿里巴巴旗下智能信息平臺夸克App正式推出全新學習產品“夸克老師”——一款集講題、批作業(yè)、出題、找試卷于一體的AI家教。該功能依托通義千問大模型,通過指令微調、強化學習等前沿技術,首次實現(xiàn)“因材施教”的個性化輔導,標志著AI在教育領域的應用邁入新階段。技術突破:AI模擬真人教學,推理能力

    標簽:
    夸克
  • 字節(jié)旗下AI工具豆包電腦版與網頁版上線“AI播客”功能,用戶可一鍵生成雙人對話播客

    2025年6月17日,字節(jié)跳動旗下智能助手豆包正式在電腦版及網頁端全量上線“AI播客”功能,用戶只需上傳PDF文檔或網頁鏈接,即可一鍵生成由兩位AI主播演繹的對話式播客節(jié)目。這一創(chuàng)新功能憑借高度擬人化的語音效果和秒級轉化效率,迅速引發(fā)內容創(chuàng)作者、學生群體及職場人士的關注。技術突破:真人級語音交互,秒

    標簽:
    豆包ai
  • DeepSeek越強,Kimi越慌?

    AI的生死競賽

    標簽:
    deepseek
  • 全球AI巨頭正在賭:誰搞定MCP,誰就是未來老大

    我不是危言聳聽,現(xiàn)在全球的AI巨頭都在做MCP,毫不夸張的說:誰能把MCP做起來,誰就擁有AI生態(tài)控制權,誰就是AI圈的老大。你們有沒有發(fā)現(xiàn),MCP在2025年初開始特別火爆,互聯(lián)網技術大廠都在強推MCP。(1)阿里云百煉搞了個MCP平臺,提供50+預置MCP服務。不過大都只面向阿里系產品。(2)騰

    標簽:
    ai智能
  • 對話李軍:人工智能是“第五范式革命”

    2025國際人工智能程序設計精英挑戰(zhàn)賽(IAEPC)在香港中文大學成功舉辦。作為主辦方之一,歐美同學基金會理事長李軍接受了大賽主持人艾誠采訪。在采訪中,李軍認為IAEPC不僅是一場“冠軍中的冠軍”對決,更是一次全球AI人才的線下交流盛會。大賽“史無前例”的吸引了全球青年科技精英匯聚香港,更加推動和普

  • 對話施韓原與杜瑜皓:與參賽選手一起改變世界

    2025國際人工智能程序設計精英挑戰(zhàn)賽(IAEPC)在香港中文大學成功舉辦。作為大賽發(fā)起人方之一及裁判委員會負責人,施韓原與杜瑜皓接受了大賽主持人艾誠采訪。裁判委員會主席施韓原分享了此次大賽的亮點,IAEPC首次引入創(chuàng)新賽道,探索選手如何與AI合作進行答題。裁判委員會副主席杜瑜皓認為,選手最終目標并

編輯推薦