123,123

　一鍵部署OpenClaw

你敢想象：僅一臺(tái)僅裝備了單塊24G顯存消費(fèi)級顯卡的系統(tǒng)，不但能跑滿血671B DeepSeek R1模型，還能帶來5并發(fā)51 Token/秒的性能（更細(xì)節(jié)數(shù)據(jù)見下圖），要知道這個(gè)性能水準(zhǔn)，足以搞定像報(bào)告解讀或數(shù)據(jù)分析這類對實(shí)時(shí)性要求不高的任務(wù)了。

這就是英特爾開發(fā)的全新異構(gòu)LLM服務(wù)方案流出的最新測試數(shù)據(jù)，這個(gè)方案基于HeteroFlow軟件框架，搭配了至強(qiáng)6性能核CPU（配MRDIMM內(nèi)存，開啟AMX加速）作為硬件基座，它的目標(biāo)就是緩解 “滿血”大模型們面臨的存力困局。

眾所周知：大模型，是樂也“大參數(shù)”，痛也“大參數(shù)”——滿血版動(dòng)輒千億級的參數(shù)規(guī)模，再疊加GPU大佬們在顯存容量上的“精準(zhǔn)”刀法，總能讓你錢包嚴(yán)重失血！如果你就搞一個(gè)節(jié)點(diǎn)，即便GPU多卡插滿，也就是能剛剛裝下海量參數(shù)，剩余的顯存會(huì)限制并發(fā)性能和上下文的長度。咬咬牙上多個(gè)節(jié)點(diǎn)，那就只能是……把牙咬碎，因?yàn)楦冻龇丁?/p>

而現(xiàn)在，有了HeteroFlow框架的加持，如果你用的是MoE類大模型，且選擇了英特爾的至強(qiáng)6性能核CPU來做機(jī)頭處理器，那么恭喜你，破局方法來了！

當(dāng)然這個(gè)方法可能會(huì)顛覆你“AI讓CPU走開”，或者“AI應(yīng)用中CPU只是GPU小助手”的觀念。但這個(gè)方法，恰恰是充分利用了GPU和CPU各自的優(yōu)勢——GPU算力強(qiáng)，CPU內(nèi)存大。HeteroFlow的工作原理就是把Attention、Dense MLP這些算力敏感型的，也是高價(jià)值的任務(wù)留給高算力的GPU，但把MoE這種需要大存力的任務(wù)，部分或全部卸載給CPU+大容量的內(nèi)存。

這種方法的終極奧義，并不是說CPU比GPU更重要，或者你不需要GPU了，而是有了CPU的分擔(dān)與協(xié)助，GPU的工作更有意義了——它能把其成本高昂的算力和顯存全用在榨取并發(fā)性能與上下文長度上，正所謂“好鋼用在刀刃上”，讓整個(gè)系統(tǒng)不僅性能收益明顯，投資回報(bào)率也是原地起飛。

接下來，讓我們瞧瞧HeteroFlow是怎樣具體干活的：

一、卸載

對AI任務(wù)做智能拆分，把部分或全部MoE負(fù)載移到CPU上，讓GPU更專注算力密集型任務(wù)，細(xì)節(jié)如下圖。

二、調(diào)度

通過Pipelined Scheduling設(shè)計(jì)，讓CPU與GPU在各自承載的子任務(wù)間實(shí)現(xiàn)無縫銜接，最大化榨取它們各自的潛能，如下圖：

三、加速

雖然至強(qiáng)CPU沒有GPU那么強(qiáng)的AI加速算力，但它還是有自己的看家本領(lǐng)——英特爾AMX（高級矩陣擴(kuò)展技術(shù)，有人將其比擬為“CPU里的Tensor Core”），它能為MoE任務(wù)涉及的計(jì)算提供加速。如果你對AMX技術(shù)沒有那么了解，可以借下面兩張圖快速了解一下它的核心組件與架構(gòu)，以及加速能力。

如果你比較細(xì)心，一定注意到我們在前文提到的是HeteroFlow框架 +至強(qiáng)6 性能核CPU這個(gè)組合，推薦這款CPU的原因很簡單，因?yàn)樗鼉?nèi)置AMX技術(shù)，且主流型號（SKU），特別是用于機(jī)頭的SKU能解鎖對MRDIMM內(nèi)存（8000/8800）的支持，幾乎是目前市面上能同時(shí)兼顧內(nèi)存的大容量與高帶寬的惟一選擇。

如果你還意猶未盡，覺得前文測試場景里的“低配”型系統(tǒng)和它實(shí)現(xiàn)的性能，還遠(yuǎn)遠(yuǎn)不能滿足你一些更加“高大上”的需求，先別急，因?yàn)橛⒊譅栒跍y試HeteroFlow+至強(qiáng)6的另外兩種應(yīng)用場景：

在更多節(jié)點(diǎn)的、中量級的系統(tǒng)中，瞧它能不能把MoE中的“冷專家”（不常被激活的專家）卸載到CPU上，盡可能提升這類系統(tǒng)的并發(fā)度和拓展其上下文長度；在更大或特大規(guī)模的AI集群中，當(dāng)GPU出現(xiàn)單卡故障時(shí)，用CPU暫時(shí)頂一下，保障集群的穩(wěn)定運(yùn)行。

由衷期待這兩個(gè)新場景能盡快落地，并有性能或性價(jià)比上的優(yōu)異表現(xiàn)供大家分享。你可以訪問英特爾官網(wǎng)了解更多基于HeteroFlow框架的異構(gòu)LLM服務(wù)方案的細(xì)節(jié)，或者聯(lián)系英特爾官方得到英特爾相關(guān)技術(shù)專家的支持。

誰說CPU只是GPU的小助手？用至強(qiáng)® 6高存力搞定MoE卸載！

想Get基于HeteroFlow的大模型異構(gòu)新方案？

歡迎訪問英特爾官網(wǎng)，即刻揭秘！

申請創(chuàng)業(yè)報(bào)道，分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處，共同探討創(chuàng)業(yè)新機(jī)遇！

相關(guān)文章

英特爾攜手火山引擎，驅(qū)動(dòng)AI應(yīng)用落地生花

英特爾亮相2025火山引擎FORCE原動(dòng)力大會(huì)·冬，全方位展示了雙方在從基礎(chǔ)設(shè)施架構(gòu)和開發(fā)工具的創(chuàng)新，到AI應(yīng)用落地等全方位的深度合作成果。通過全?；A(chǔ)設(shè)施的深度整合，雙方正將前沿智能技術(shù)轉(zhuǎn)化為即取即用、協(xié)同高效的生產(chǎn)力，推動(dòng)AI從單點(diǎn)能力演進(jìn)為全面系統(tǒng)化的業(yè)務(wù)支撐。英特爾市場營銷集團(tuán)副總裁、中國區(qū)

標(biāo)簽：

英特爾
英特爾攜手產(chǎn)學(xué)合作伙伴發(fā)布《具身智能機(jī)器人安全子系統(tǒng)白皮書》

近日，在2025英特爾中國學(xué)術(shù)峰會(huì)上，英特爾聯(lián)合學(xué)界及產(chǎn)業(yè)界的合作伙伴發(fā)布了《具身智能機(jī)器人安全子系統(tǒng)白皮書》（以下簡稱《白皮書》），從系統(tǒng)架構(gòu)層面提出了一個(gè)安全子系統(tǒng)的設(shè)計(jì)框架，旨在為機(jī)器人系統(tǒng)提供全方位、多層次的安全保障。此白皮書由來自英特爾中國研究院、武漢大學(xué)、香港中文大學(xué)（深圳）、清華大學(xué)、

標(biāo)簽：

英特爾
終端 AI 奇點(diǎn)已至，英特爾點(diǎn)燃 PC 新范式

導(dǎo)語：英特爾正通過其XPU混合架構(gòu)、AI算力以及開放的軟件生態(tài)來引領(lǐng)這一趨勢。AIPC市場的競爭正在升溫，格局也在重塑。無論是對于終端AI的討論，還是智能硬件的熱潮，其本質(zhì)都是關(guān)于下一代計(jì)算入口的爭奪，其底層邏輯是，將智能無縫融入個(gè)人設(shè)備，讓AI從需要主動(dòng)調(diào)用的工具，演變?yōu)殡S時(shí)待命、主動(dòng)服務(wù)的環(huán)境能

標(biāo)簽：

英特爾
下一個(gè)爆款在哪兒？2025英特爾人工智能創(chuàng)新應(yīng)用大賽獲獎(jiǎng)名單揭曉

8月16日，2025英特爾人工智能創(chuàng)新應(yīng)用大賽總決賽暨頒獎(jiǎng)典禮在深圳盛大啟幕。

標(biāo)簽：

英特爾
AI PC應(yīng)用新突破：英特爾三大生態(tài)伙伴上線全新應(yīng)用

近日，英特爾的AIPC生態(tài)伙伴——虎踞龍盤英特爾AIPC專區(qū)、小旺AI截圖工具以及“瑞士軍刀”級的CherryStudio多合一AI助手已分別正式上線，為AIPC體驗(yàn)再添應(yīng)用新突破！

標(biāo)簽：

英特爾

當(dāng)前位置：首頁 > 科技 > IT業(yè)界 > 正文

大模型千億參數(shù)讓GPU顯存告急，英特爾居然讓你試試CPU

相關(guān)文章

英特爾攜手火山引擎，驅(qū)動(dòng)AI應(yīng)用落地生花

英特爾攜手產(chǎn)學(xué)合作伙伴發(fā)布《具身智能機(jī)器人安全子系統(tǒng)白皮書》

終端 AI 奇點(diǎn)已至，英特爾點(diǎn)燃 PC 新范式

下一個(gè)爆款在哪兒？2025英特爾人工智能創(chuàng)新應(yīng)用大賽獲獎(jiǎng)名單揭曉

AI PC應(yīng)用新突破：英特爾三大生態(tài)伙伴上線全新應(yīng)用

熱門排行

信息推薦

編輯推薦

阿里一元店是新解“囊”雜貨鋪？

億企聯(lián)解答互聯(lián)網(wǎng)廣告的存在意義何在？

熱門標(biāo)簽

當(dāng)前位置：首頁 > 科技 > IT業(yè)界 > 正文

大模型千億參數(shù)讓GPU顯存告急，英特爾居然讓你試試CPU

相關(guān)文章

英特爾攜手火山引擎，驅(qū)動(dòng)AI應(yīng)用落地生花

英特爾攜手產(chǎn)學(xué)合作伙伴發(fā)布《具身智能機(jī)器人安全子系統(tǒng)白皮書》

終端 AI 奇點(diǎn)已至，英特爾點(diǎn)燃 PC 新范式

下一個(gè)爆款在哪兒？2025英特爾人工智能創(chuàng)新應(yīng)用大賽獲獎(jiǎng)名單揭曉

AI PC應(yīng)用新突破：英特爾三大生態(tài)伙伴上線全新應(yīng)用

熱門排行

信息推薦

編輯推薦

阿里一元店是新解“囊”雜貨鋪？

億企聯(lián)解答互聯(lián)網(wǎng)廣告的存在意義何在？

熱門標(biāo)簽

英特爾攜手火山引擎，驅(qū)動(dòng)AI應(yīng)用落地生花

終端 AI 奇點(diǎn)已至，英特爾點(diǎn)燃 PC 新范式

下一個(gè)爆款在哪兒？2025英特爾人工智能創(chuàng)新應(yīng)用大賽獲獎(jiǎng)名單揭曉

阿里一元店是新解“囊”雜貨鋪？