當前位置:首頁 >  科技 >  IT業(yè)界 >  正文

AI游刃有余 | 浪潮云海InCloud AIOS:異構(gòu)算力“小時級”適配 打通智能生產(chǎn)力最后一公里

 2026-01-26 13:47  來源: 互聯(lián)網(wǎng)   我來投稿 撤稿糾錯

  阿里云優(yōu)惠券 先領(lǐng)券再下單

隨著AI技術(shù)與產(chǎn)業(yè)加速迭代,異構(gòu)加速設(shè)備與大模型層出不窮,為企業(yè)智能化轉(zhuǎn)型注入動能的同時,也給AI基礎(chǔ)設(shè)施帶來兩大核心挑戰(zhàn):

* 算力適配滯后:全球產(chǎn)業(yè)鏈重構(gòu)背景下,GPU廠商、架構(gòu)、型號持續(xù)迭代,數(shù)據(jù)中心多元異構(gòu)成為常態(tài),AI基礎(chǔ)設(shè)施難以快速跟進最新算力迭代,適配周期長;

* 生態(tài)兼容不足:新型GPU上市后,芯片廠商會定制適配推理引擎以支持主流大模型快速部署,而傳統(tǒng)AI基礎(chǔ)設(shè)施難以同步匹配最新生態(tài),導致算力無法快速轉(zhuǎn)化為生產(chǎn)力。

針對上述問題,浪潮云海InCloud AIOS秉承“分層解耦、開放兼容”核心理念,創(chuàng)新推出異構(gòu)加速設(shè)備動態(tài)擴展方法,設(shè)計了面向異構(gòu)算力的推理引擎快速適配框架,實現(xiàn)新架構(gòu)、新型號加速設(shè)備的小時級兼容,通過智能調(diào)度讓已兼容模型高效運行,打通從算力到智能生產(chǎn)力的“最后一公里”,成為AI時代企業(yè)異構(gòu)算力管理的最佳伙伴。

異構(gòu)加速設(shè)備動態(tài)擴展:小時級兼容新算力,打破異構(gòu)壁壘

浪潮云海InCloud AIOS基于device-plugin機制構(gòu)建異構(gòu)設(shè)備擴展框架,向下適配各廠商設(shè)備管理模塊,向上銜接產(chǎn)品GPU管理功能。

深度遵循PCI設(shè)備規(guī)范,在宿主機內(nèi)核態(tài)與用戶態(tài)協(xié)同層面構(gòu)建精細化設(shè)備探測引擎:通過通用唯一PCI設(shè)備標識符(Device ID/Vendor ID) 實現(xiàn)跨廠商GPU的自動化發(fā)現(xiàn)與精準識別,解決傳統(tǒng)方案中識別效率低、識別不準確的問題;以設(shè)備號為索引主鍵,關(guān)聯(lián)提取GPU 的硬件拓撲、算力規(guī)格、顯存容量與帶寬、虛擬化能力等通用屬性,將其抽象為標準化的節(jié)點標簽(Node Label)并上報至Kubernetes控制平面,為算力資源調(diào)度提供依據(jù)。

針對多廠商GPU數(shù)據(jù)格式異構(gòu)、能力描述碎片化的問題,首創(chuàng)面向AI負載的GPU統(tǒng)一能力模型,通過抽象層設(shè)計,將不同生態(tài)的GPU異構(gòu)數(shù)據(jù)(如算力單元、顯存帶寬、指令集支持)與差異化能力映射為標準化數(shù)據(jù)結(jié)構(gòu),基于該模型實現(xiàn)“統(tǒng)一節(jié)點能力畫像”的精細化資源表征。

在產(chǎn)品界面依托統(tǒng)一能力模型,實現(xiàn)GPU資源的全景統(tǒng)計、可視化呈現(xiàn)與智能化調(diào)度,打破傳統(tǒng)方案的割裂管理模式,大幅縮短異構(gòu)GPU兼容性適配周期,解決統(tǒng)一管理難題。

異構(gòu)加速設(shè)備動態(tài)擴展方法

推理引擎快速適配框架:快速適配生態(tài),高效部署模型

不同類型模型(文本生成、多模態(tài)、嵌入式等)對推理引擎需求各異,且GPU與推理引擎版本強依賴,給模型部署帶來挑戰(zhàn)。浪潮云海InCloud AIOS以K8s為底座,設(shè)計推理引擎快速適配框架,實現(xiàn)異構(gòu)GPU與推理引擎的高效兼容。

構(gòu)建統(tǒng)一的“模型-GPU-推理引擎”映射模型,通過配置化操作完成不同類型模型在異構(gòu) GPU 上的推理引擎版本匹配,為模型加載決策提供清晰依據(jù)。

在K8s層面統(tǒng)一封裝工作負載接口,自研模型加載調(diào)度器作為推理引擎啟動的統(tǒng)一入口,提供模型文件分發(fā)狀態(tài)判斷、環(huán)境變量讀取、啟動參數(shù)配置、本地軟鏈接創(chuàng)建等功能,徹底屏蔽各類推理引擎的參數(shù)差異,降低使用門檻。

復用已有的GPU快速適配能力,擴展K8s調(diào)度框架,根據(jù)GPU型號將推理引擎調(diào)度到最佳的主機上加載模型,通過svc方式使用OpenAI格式接口對外提供推理服務(wù)。

推理引擎快速適配框架

零代碼改動,一小時完成千億模型適配

通過兩大核心技術(shù)創(chuàng)新,浪潮云海InCloud AIOS已實現(xiàn)多廠商、多架構(gòu)GPU型號適配,支持自研及vLLM、SGLang等面向不同GPU的推理引擎版本,充分驗證了“一云多算”的實戰(zhàn)能力。

在某政府行業(yè)客戶現(xiàn)場,浪潮云海 AIOS 在零代碼改動的前提下,僅用一小時就完成某架構(gòu)最新型號 GPU 的兼容與推理引擎適配,以分布式方式成功運行DeepSeek最新發(fā)布的千億參數(shù)模型,提供穩(wěn)定可靠的模型服務(wù),獲得客戶高度認可。

客戶現(xiàn)場新適配的GPU與產(chǎn)品能力無縫銜接

開放兼容,讓 AI 算力游刃有余

AI正從工具加速進化為“數(shù)字勞動力”,異構(gòu)算力的高效管理成為企業(yè)智能化轉(zhuǎn)型的關(guān)鍵。浪潮云海InCloud AIOS通過“異構(gòu)加速設(shè)備動態(tài)擴展+推理引擎快速適配”的雙重創(chuàng)新,打破了算力與生態(tài)的兼容壁壘,實現(xiàn)新算力小時級接入、模型高效部署,讓企業(yè)無需為異構(gòu)兼容發(fā)愁,專注于AI應(yīng)用創(chuàng)新。

未來,浪潮云海InCloud AIOS將持續(xù)聚焦推理性能優(yōu)化與算力資源使用率提升,不斷深化軟硬協(xié)同能力,為行業(yè)客戶提供高效穩(wěn)定的AI基礎(chǔ)設(shè)施,助力企業(yè)在異構(gòu)算力時代從容駕馭AI浪潮,實現(xiàn)智能化轉(zhuǎn)型游刃有余。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關(guān)標簽
浪潮云海

相關(guān)文章

  • AI游刃有余 告別模型選型迷茫!浪潮云海InCloud AIOS科學評估體系,讓決策心中有數(shù)

    當前AI領(lǐng)域大模型技術(shù)飛速迭代,全球已發(fā)布數(shù)千個大模型,其中我國大模型數(shù)量突破1500個;與此同時,AI算力芯片、服務(wù)器型號也層出不窮、快速迭代。“海量模型+多樣硬件”的雙重疊加,讓企業(yè)陷入選型困境:該選哪款模型適配業(yè)務(wù)?配置何種硬件才夠用?選型是否匹配實際需求?試錯成本高、匹配度難把控,成為企業(yè)落

    標簽:
    浪潮云海
  • AI 游刃有余 | 浪潮云海InCloud AIOS:告別“找錯書”與“看不全頁”,RAG檢索不跑偏

    在AI深度落地的當下,構(gòu)建高效精準的智能問答系統(tǒng),已成為企業(yè)提升客戶體驗、優(yōu)化內(nèi)部效率的關(guān)鍵。但基于大語言模型的RAG(檢索增強生成)系統(tǒng)落地時,兩大核心痛點常讓企業(yè)陷入困境:*一是知識庫按產(chǎn)品型號、版本分區(qū)管理,語義高度相似導致系統(tǒng)“找錯書”,比如詢問A型號故障卻返回B型號方案;*二是文檔切分粒度

    標簽:
    浪潮云海
  • AI游刃有余 | 告別運維焦慮,浪潮云海OS解鎖智能運維快車道

    近來,企業(yè)云平臺納管的資源規(guī)模持續(xù)激增,架構(gòu)復雜度呈指數(shù)級上升,傳統(tǒng)運維模式早已不堪重負,各類運維焦慮層出不窮:*資源檢索大海撈針:查找資源,需在十幾個菜單間反復跳轉(zhuǎn);*數(shù)據(jù)報表僵化受限:只能按預設(shè)條件檢索和固定表頭展示;*日常巡檢低效易錯:面對大量非健康指標,只能依靠人工關(guān)聯(lián)分析。面對傳統(tǒng)交互模式

    標簽:
    浪潮云海

熱門排行

信息推薦