123,123

隨著AI技術與產(chǎn)業(yè)加速迭代，異構加速設備與大模型層出不窮，為企業(yè)智能化轉型注入動能的同時，也給AI基礎設施帶來兩大核心挑戰(zhàn)：

* 算力適配滯后：全球產(chǎn)業(yè)鏈重構背景下，GPU廠商、架構、型號持續(xù)迭代，數(shù)據(jù)中心多元異構成為常態(tài)，AI基礎設施難以快速跟進最新算力迭代，適配周期長；

* 生態(tài)兼容不足：新型GPU上市后，芯片廠商會定制適配推理引擎以支持主流大模型快速部署，而傳統(tǒng)AI基礎設施難以同步匹配最新生態(tài)，導致算力無法快速轉化為生產(chǎn)力。

針對上述問題，浪潮云海InCloud AIOS秉承“分層解耦、開放兼容”核心理念，創(chuàng)新推出異構加速設備動態(tài)擴展方法，設計了面向異構算力的推理引擎快速適配框架，實現(xiàn)新架構、新型號加速設備的小時級兼容，通過智能調度讓已兼容模型高效運行，打通從算力到智能生產(chǎn)力的“最后一公里”，成為AI時代企業(yè)異構算力管理的最佳伙伴。

異構加速設備動態(tài)擴展：小時級兼容新算力，打破異構壁壘

浪潮云海InCloud AIOS基于device-plugin機制構建異構設備擴展框架，向下適配各廠商設備管理模塊，向上銜接產(chǎn)品GPU管理功能。

深度遵循PCI設備規(guī)范，在宿主機內核態(tài)與用戶態(tài)協(xié)同層面構建精細化設備探測引擎：通過通用唯一PCI設備標識符（Device ID/Vendor ID）實現(xiàn)跨廠商GPU的自動化發(fā)現(xiàn)與精準識別，解決傳統(tǒng)方案中識別效率低、識別不準確的問題；以設備號為索引主鍵，關聯(lián)提取GPU 的硬件拓撲、算力規(guī)格、顯存容量與帶寬、虛擬化能力等通用屬性，將其抽象為標準化的節(jié)點標簽（Node Label）并上報至Kubernetes控制平面，為算力資源調度提供依據(jù)。

針對多廠商GPU數(shù)據(jù)格式異構、能力描述碎片化的問題，首創(chuàng)面向AI負載的GPU統(tǒng)一能力模型，通過抽象層設計，將不同生態(tài)的GPU異構數(shù)據(jù)（如算力單元、顯存帶寬、指令集支持）與差異化能力映射為標準化數(shù)據(jù)結構，基于該模型實現(xiàn)“統(tǒng)一節(jié)點能力畫像”的精細化資源表征。

在產(chǎn)品界面依托統(tǒng)一能力模型，實現(xiàn)GPU資源的全景統(tǒng)計、可視化呈現(xiàn)與智能化調度，打破傳統(tǒng)方案的割裂管理模式，大幅縮短異構GPU兼容性適配周期，解決統(tǒng)一管理難題。

異構加速設備動態(tài)擴展方法

推理引擎快速適配框架：快速適配生態(tài)，高效部署模型

不同類型模型（文本生成、多模態(tài)、嵌入式等）對推理引擎需求各異，且GPU與推理引擎版本強依賴，給模型部署帶來挑戰(zhàn)。浪潮云海InCloud AIOS以K8s為底座，設計推理引擎快速適配框架，實現(xiàn)異構GPU與推理引擎的高效兼容。

構建統(tǒng)一的“模型-GPU-推理引擎”映射模型，通過配置化操作完成不同類型模型在異構 GPU 上的推理引擎版本匹配，為模型加載決策提供清晰依據(jù)。

在K8s層面統(tǒng)一封裝工作負載接口，自研模型加載調度器作為推理引擎啟動的統(tǒng)一入口，提供模型文件分發(fā)狀態(tài)判斷、環(huán)境變量讀取、啟動參數(shù)配置、本地軟鏈接創(chuàng)建等功能，徹底屏蔽各類推理引擎的參數(shù)差異，降低使用門檻。

復用已有的GPU快速適配能力，擴展K8s調度框架，根據(jù)GPU型號將推理引擎調度到最佳的主機上加載模型，通過svc方式使用OpenAI格式接口對外提供推理服務。

推理引擎快速適配框架

零代碼改動，一小時完成千億模型適配

通過兩大核心技術創(chuàng)新，浪潮云海InCloud AIOS已實現(xiàn)多廠商、多架構GPU型號適配，支持自研及vLLM、SGLang等面向不同GPU的推理引擎版本，充分驗證了“一云多算”的實戰(zhàn)能力。

在某政府行業(yè)客戶現(xiàn)場，浪潮云海 AIOS 在零代碼改動的前提下，僅用一小時就完成某架構最新型號 GPU 的兼容與推理引擎適配，以分布式方式成功運行DeepSeek最新發(fā)布的千億參數(shù)模型，提供穩(wěn)定可靠的模型服務，獲得客戶高度認可。

客戶現(xiàn)場新適配的GPU與產(chǎn)品能力無縫銜接

開放兼容，讓 AI 算力游刃有余

AI正從工具加速進化為“數(shù)字勞動力”，異構算力的高效管理成為企業(yè)智能化轉型的關鍵。浪潮云海InCloud AIOS通過“異構加速設備動態(tài)擴展+推理引擎快速適配”的雙重創(chuàng)新，打破了算力與生態(tài)的兼容壁壘，實現(xiàn)新算力小時級接入、模型高效部署，讓企業(yè)無需為異構兼容發(fā)愁，專注于AI應用創(chuàng)新。

未來，浪潮云海InCloud AIOS將持續(xù)聚焦推理性能優(yōu)化與算力資源使用率提升，不斷深化軟硬協(xié)同能力，為行業(yè)客戶提供高效穩(wěn)定的AI基礎設施，助力企業(yè)在異構算力時代從容駕馭AI浪潮，實現(xiàn)智能化轉型游刃有余。

申請創(chuàng)業(yè)報道，分享創(chuàng)業(yè)好點子。點擊此處，共同探討創(chuàng)業(yè)新機遇！

AI游刃有余告別模型選型迷茫！浪潮云海InCloud AIOS科學評估體系，讓決策心中有數(shù)

當前AI領域大模型技術飛速迭代，全球已發(fā)布數(shù)千個大模型，其中我國大模型數(shù)量突破1500個；與此同時，AI算力芯片、服務器型號也層出不窮、快速迭代?！昂Ａ磕Ｐ?多樣硬件”的雙重疊加，讓企業(yè)陷入選型困境：該選哪款模型適配業(yè)務？配置何種硬件才夠用？選型是否匹配實際需求？試錯成本高、匹配度難把控，成為企業(yè)落

標簽：

浪潮云海
AI 游刃有余 | 浪潮云海InCloud AIOS：告別“找錯書”與“看不全頁”，RAG檢索不跑偏

在AI深度落地的當下，構建高效精準的智能問答系統(tǒng)，已成為企業(yè)提升客戶體驗、優(yōu)化內部效率的關鍵。但基于大語言模型的RAG（檢索增強生成）系統(tǒng)落地時，兩大核心痛點常讓企業(yè)陷入困境：*一是知識庫按產(chǎn)品型號、版本分區(qū)管理，語義高度相似導致系統(tǒng)“找錯書”，比如詢問A型號故障卻返回B型號方案；*二是文檔切分粒度

標簽：

浪潮云海
AI游刃有余 | 告別運維焦慮，浪潮云海OS解鎖智能運維快車道

近來，企業(yè)云平臺納管的資源規(guī)模持續(xù)激增，架構復雜度呈指數(shù)級上升，傳統(tǒng)運維模式早已不堪重負，各類運維焦慮層出不窮：*資源檢索大海撈針：查找資源，需在十幾個菜單間反復跳轉；*數(shù)據(jù)報表僵化受限：只能按預設條件檢索和固定表頭展示；*日常巡檢低效易錯：面對大量非健康指標，只能依靠人工關聯(lián)分析。面對傳統(tǒng)交互模式

標簽：

浪潮云海

當前位置：首頁 > 科技 > IT業(yè)界 > 正文

AI游刃有余 | 浪潮云海InCloud AIOS：異構算力“小時級”適配打通智能生產(chǎn)力最后一公里

相關文章

AI游刃有余告別模型選型迷茫！浪潮云海InCloud AIOS科學評估體系，讓決策心中有數(shù)

AI 游刃有余 | 浪潮云海InCloud AIOS：告別“找錯書”與“看不全頁”，RAG檢索不跑偏

AI游刃有余 | 告別運維焦慮，浪潮云海OS解鎖智能運維快車道

熱門排行

信息推薦

編輯推薦

阿里一元店是新解“囊”雜貨鋪？

億企聯(lián)解答互聯(lián)網(wǎng)廣告的存在意義何在？

熱門標簽

當前位置：首頁 > 科技 > IT業(yè)界 > 正文

AI游刃有余 | 浪潮云海InCloud AIOS：異構算力“小時級”適配 打通智能生產(chǎn)力最后一公里

相關文章

AI游刃有余 告別模型選型迷茫！浪潮云海InCloud AIOS科學評估體系，讓決策心中有數(shù)