CPU上跑AI？從推薦系統(tǒng)的演進(jìn)看CPU的崛起

2024-04-16 14:13 來(lái)源：互聯(lián)網(wǎng) 我來(lái)投稿撤稿糾錯(cuò)

在信息和數(shù)據(jù)極度繁榮的當(dāng)下，人工智能正在通過(guò)各種方式影響著人類(lèi)生活。其中，AI推薦系統(tǒng)作為互聯(lián)網(wǎng)時(shí)代最關(guān)鍵的伴生技術(shù)之一，正在幫助人類(lèi)梳理著各種紛繁雜亂的信息，讓資源實(shí)現(xiàn)更精準(zhǔn)的調(diào)配，讓一切變得井然有序。

推薦系統(tǒng)：數(shù)字營(yíng)銷(xiāo)的重要引擎

當(dāng)你到一座旅游城市，不知道當(dāng)?shù)赜惺裁疵朗硶r(shí)，AI推薦系統(tǒng)在手機(jī)上的本地生活平臺(tái)會(huì)為你列出當(dāng)?shù)厮忻朗常?/p>

當(dāng)你在線上購(gòu)物，不知道時(shí)下有哪些新款式衣服時(shí)，AI推薦系統(tǒng)在電商平臺(tái)上又會(huì)為你列出應(yīng)季又適合你的衣服。

對(duì)于企業(yè)而言，AI推薦系統(tǒng)更為重要，在浩渺的商業(yè)世界里，AI推薦系統(tǒng)就像一條秩序鏈，通過(guò)這條秩序鏈，數(shù)以千萬(wàn)計(jì)的企業(yè)得以找到分布在全球各地最需要他們產(chǎn)品的用戶。

上海市人工智能行業(yè)協(xié)會(huì)秘書(shū)長(zhǎng)鐘俊浩指出：“隨著人工智能技術(shù)的迅速發(fā)展及軟硬件進(jìn)步，我們正步入一個(gè)AI技術(shù)廣泛應(yīng)用并深刻影響各行各業(yè)的新時(shí)代，與此同時(shí)，如今電商、個(gè)性化廣告等諸多商業(yè)場(chǎng)景背后都在以AI推薦系統(tǒng)作為依托，AI推薦系統(tǒng)已經(jīng)是人工智能技術(shù)在商業(yè)領(lǐng)域最為成熟的應(yīng)用之一。”

數(shù)字營(yíng)銷(xiāo)就是使用了AI推薦系統(tǒng)的一個(gè)主要場(chǎng)景，作為國(guó)內(nèi)領(lǐng)先的商業(yè)數(shù)字營(yíng)銷(xiāo)平臺(tái)，阿里媽媽就在用AI推薦系統(tǒng)為企業(yè)提供全鏈路的營(yíng)銷(xiāo)解決方案。

阿里媽媽的使命是“讓天下沒(méi)有難做的營(yíng)銷(xiāo)”，通過(guò)自研的數(shù)字營(yíng)銷(xiāo)平臺(tái)，阿里媽媽每年都在為各行各業(yè)的商家和品牌解決一系列營(yíng)銷(xiāo)和廣告投放問(wèn)題，通過(guò)精準(zhǔn)營(yíng)銷(xiāo)幫助商家將產(chǎn)品推廣到最需要他們的消費(fèi)者面前，從而幫助企業(yè)實(shí)現(xiàn)他們應(yīng)有的價(jià)值。

為了將海量商品與消費(fèi)者進(jìn)行更加精準(zhǔn)的匹配，阿里媽媽的AI推薦算法和模型在過(guò)往幾年里一直在不斷升級(jí)迭代，與此同時(shí)，日益復(fù)雜的AI模型也使得AI推薦系統(tǒng)對(duì)硬件算力的需求越來(lái)越高。

“線上購(gòu)物已經(jīng)很普遍，實(shí)際上，每次用戶在線上瀏覽商品都會(huì)涉及百億量級(jí)的浮點(diǎn)運(yùn)算”，阿里媽媽軟件工程師劉征宇解釋稱。

由此帶來(lái)的是日益增長(zhǎng)的算力需求和有限算力供給之間的矛盾，這一矛盾也成了像阿里媽媽這樣基于人工智能技術(shù)開(kāi)展數(shù)字營(yíng)銷(xiāo)業(yè)務(wù)的企業(yè)的一大痛點(diǎn)。

要解決這一痛點(diǎn)，最直接的方法就是增加AI算力、優(yōu)化AI算法。尤其是AI算力的提升，是數(shù)字營(yíng)銷(xiāo)業(yè)務(wù)不斷升級(jí)迭代最重要的保障。

是挑戰(zhàn)也是機(jī)遇，最適合的才是最好的

大模型的出現(xiàn)，讓GPU呼聲越來(lái)越高，似乎GPU在一夜之間成了人工智能技術(shù)在算力上的唯一選擇。

其實(shí)不然，在數(shù)字營(yíng)銷(xiāo)這樣實(shí)際商業(yè)應(yīng)用場(chǎng)景中，GPU不僅不是唯一選擇，甚至也可能不是最優(yōu)解。

實(shí)際上，人工智能技術(shù)對(duì)于算力的強(qiáng)需求主要來(lái)自于AI訓(xùn)練和AI推理兩方面。而要想將人工智能技術(shù)轉(zhuǎn)化為各行各業(yè)的生產(chǎn)力，幫助各行各業(yè)提升生產(chǎn)效率，最關(guān)鍵的是AI推理。

鐘俊浩也做過(guò)解析：“在大模型深入產(chǎn)業(yè)的這一年里，越來(lái)越多行業(yè)開(kāi)始關(guān)注AI推理，而如何將CPU發(fā)揮到極致，加速AI推理，并推動(dòng)其產(chǎn)業(yè)落地就成了關(guān)鍵問(wèn)題。”

某些硬件廠商對(duì)于推薦系統(tǒng)、語(yǔ)音識(shí)別、圖像識(shí)別、基因測(cè)序這樣傳統(tǒng)的AI應(yīng)用，在CPU上已經(jīng)做了大量的優(yōu)化。特別是在執(zhí)行AI推理任務(wù)時(shí)，經(jīng)過(guò)優(yōu)化的大模型在CPU上已經(jīng)可以實(shí)現(xiàn)高效執(zhí)行。

英特爾數(shù)據(jù)中心和人工智能集團(tuán)至強(qiáng)生態(tài)賦能事業(yè)部（中國(guó)）總經(jīng)理李亞?wèn)|就指出：“當(dāng)模型很大，涉及到需要跨異構(gòu)平臺(tái)計(jì)算時(shí)，使用CPU速度反而更快，效率也更高。”

2023年12月，英特爾在國(guó)內(nèi)正式發(fā)布了第五代至強(qiáng)® 可擴(kuò)展處理器，它從多方面提升了硬件算力，包括頻率，功耗，LLC緩存，內(nèi)存帶寬和延遲都有明顯的改進(jìn)。

最關(guān)鍵的是它內(nèi)置的英特爾® 高級(jí)矩陣擴(kuò)展（英特爾® AMX技術(shù)），特別針對(duì)深度學(xué)習(xí)模型最常見(jiàn)的矩陣乘法運(yùn)算優(yōu)化，支持BF16（訓(xùn)練/推理）和INT8（推理）等常見(jiàn)數(shù)據(jù)類(lèi)型。

英特爾® AMX位于每個(gè)CPU內(nèi)核上并靠近系統(tǒng)內(nèi)存，可減少數(shù)據(jù)傳輸延遲、提高數(shù)據(jù)傳輸帶寬，并且同步降低實(shí)際使用上的復(fù)雜性。

實(shí)際上，在目前AI推薦系統(tǒng)面臨的硬件算力挑戰(zhàn)中，CPU已經(jīng)成了解決AI推理計(jì)算需求的核心算力。

據(jù)劉征宇透露：“阿里媽媽在選擇以第五代英特爾® 至強(qiáng)® 可擴(kuò)展處理器作為算力平臺(tái)，使用英特爾® AMX和AVX-512優(yōu)化后，針對(duì)廣告推薦模型，性能相比第四代至強(qiáng)® 可擴(kuò)展處理器有了明顯提升，在滿足SLA的前提下，吞吐量提升（達(dá)）1.52倍。”

基于此，阿里媽媽通過(guò)不斷提升算力和優(yōu)化算法，使得整個(gè)營(yíng)銷(xiāo)鏈條更加絲滑，也更加智能高效。

除了硬件創(chuàng)新，英特爾在軟件方面也在持續(xù)發(fā)力，以確?，F(xiàn)有的AI框架和應(yīng)用能夠充分發(fā)揮出硬件潛力。

英特爾不僅持續(xù)為主流開(kāi)源框架PyTorch、TensorFlow等貢獻(xiàn)力量，還提供了多種針對(duì)CPU平臺(tái)的優(yōu)化插件，如IPEX（Intel® Extension for PyTorch）、ITEX（Intel® Extension for TensorFlow）等，同時(shí)提供了諸如xFT（xFasterTransformer）、OpenVINO™ 工具套件等多種優(yōu)化工具。

“最適合的，才是最好的，我們現(xiàn)在最需要的不是無(wú)限高的算力，而是擁有足夠算力的超能戰(zhàn)士。”劉征宇進(jìn)一步解釋稱。

同樣， CPU平臺(tái)廣泛部署、易于獲取，便于應(yīng)用和優(yōu)化，能兼顧通用計(jì)算又能做推理加速，且不用為此導(dǎo)入異構(gòu)帶來(lái)的各種復(fù)雜性，自然就會(huì)收獲高效的應(yīng)用表現(xiàn)、落地速度和更強(qiáng)的成本競(jìng)爭(zhēng)力。

以阿里媽媽所在的數(shù)字營(yíng)銷(xiāo)應(yīng)用場(chǎng)景為例，無(wú)論是矩陣乘法這樣計(jì)算密集型的AI運(yùn)算，還是數(shù)據(jù)查詢這樣訪存密集型的AI運(yùn)算，都離不開(kāi)CPU的參與。

即便是在CPU-GPU協(xié)同應(yīng)用場(chǎng)景中，GPU這樣協(xié)處理器的算力發(fā)揮作用，也非常依賴CPU的處理速度。

用CPU加速AI落地，未來(lái)可期，大有可為

如果說(shuō)2023年是大模型技術(shù)爆發(fā)的一年，那么，2024年就是大模型深入產(chǎn)業(yè)應(yīng)用的關(guān)鍵年。不論是大模型還是傳統(tǒng)的AI技術(shù)，要想得到落地，做到“快、好、省”才是關(guān)鍵。

CPU能確保整個(gè)系統(tǒng)的穩(wěn)定運(yùn)行、各組件的高效通信協(xié)作，并最終推進(jìn)任務(wù)的順利執(zhí)行。

除了熱門(mén)的AI推理和訓(xùn)練，一條AI流水線中還包括數(shù)據(jù)預(yù)處理、后處理等可能需要CPU通用處理能力的環(huán)節(jié)。在這些環(huán)節(jié)中，CPU具備的通用性和靈活性，能夠適應(yīng)各種不同的計(jì)算場(chǎng)景，適應(yīng)廣泛的應(yīng)用需求。

第五代至強(qiáng)® 可擴(kuò)展處理器充分考慮到這些需求，內(nèi)置了諸如英特爾® 數(shù)據(jù)流加速器（英特爾® DSA）來(lái)主攻數(shù)據(jù)存儲(chǔ)與傳輸；英特爾® 存內(nèi)分析加速器（英特爾® IAA）來(lái)針對(duì)數(shù)據(jù)庫(kù)和數(shù)據(jù)分析加速；英特爾® 數(shù)據(jù)保護(hù)與壓縮加速技術(shù)（英特爾® QAT）來(lái)加速數(shù)據(jù)壓縮、對(duì)稱和非對(duì)稱數(shù)據(jù)加密解密，提高CPU效率和整體系統(tǒng)性能。

李亞?wèn)|還指出：“從企業(yè)長(zhǎng)遠(yuǎn)發(fā)展來(lái)看，CPU在穩(wěn)定性、安全性等方面的表現(xiàn)值得信賴，這對(duì)于保護(hù)企業(yè)數(shù)據(jù)和客戶隱私至關(guān)重要。第五代至強(qiáng)® 可擴(kuò)展處理器內(nèi)置的英特爾® SGX和TDX，可以為企業(yè)分別提供更強(qiáng)、更易用的應(yīng)用隔離能力和虛擬機(jī)層面的隔離和保密性，為現(xiàn)有應(yīng)用提供了一條更簡(jiǎn)便的向可信執(zhí)行環(huán)境遷移的路徑。”

未來(lái)英特爾數(shù)據(jù)中心產(chǎn)品組合，預(yù)計(jì)可以覆蓋通用計(jì)算與AI加速，實(shí)現(xiàn)從數(shù)據(jù)預(yù)處理、到模型訓(xùn)練與優(yōu)化，再到部署與推理的AI“全管線”加速。

CPU不僅是老伙伴，還是新變量，隨著新一代CPU在各方面性能的不斷提升，CPU也正在成為為千行萬(wàn)業(yè)企業(yè)智能化轉(zhuǎn)型提供源源不斷動(dòng)力的心臟。

正如鐘俊浩所說(shuō)：“持續(xù)創(chuàng)新和進(jìn)化的CPU，在全新技術(shù)周期下，成為一代又一代科學(xué)家留給新時(shí)代最好的禮物。”

申請(qǐng)創(chuàng)業(yè)報(bào)道，分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處，共同探討創(chuàng)業(yè)新機(jī)遇！

CPU上跑AI？從推薦系統(tǒng)的演進(jìn)看CPU的崛起

相關(guān)文章

一秒當(dāng)導(dǎo)演：小云雀上線短劇Agent，10萬(wàn)字劇本一鍵生成60集

騰訊云推出“龍蝦”記憶服務(wù)，準(zhǔn)確率飆升近六成

谷歌 Gemma 4 正式開(kāi)源，開(kāi)源賽道迎來(lái)變局！

OpenClaw常見(jiàn)的五種“病”，到底該怎么“治”？

普通人怎么養(yǎng)AI龍蝦，別讓你的AI龍蝦餓著或撐著

選對(duì)版本和“飼料”，OpenClaw小龍蝦才能長(zhǎng)得壯

入坑OpenClaw前，先問(wèn)問(wèn)自己這三件事

字節(jié)火山引擎Seedance 2.0正式面向普通API客戶開(kāi)放申請(qǐng)，豆包大模型日均Token使用量突破120萬(wàn)億

養(yǎng)“蝦”被騙、數(shù)據(jù)泄露、天價(jià)賬單……遇到這些糟心事該怎么辦？

把“鑰匙”交給AI，如何防止它“拆家”？數(shù)據(jù)安全實(shí)操手冊(cè)

熱門(mén)排行

編輯推薦