在信息和數(shù)據(jù)極度繁榮的當(dāng)下,人工智能正在通過(guò)各種方式影響著人類(lèi)生活。其中,AI推薦系統(tǒng)作為互聯(lián)網(wǎng)時(shí)代最關(guān)鍵的伴生技術(shù)之一,正在幫助人類(lèi)梳理著各種紛繁雜亂的信息,讓資源實(shí)現(xiàn)更精準(zhǔn)的調(diào)配,讓一切變得井然有序。
推薦系統(tǒng):數(shù)字營(yíng)銷(xiāo)的重要引擎
當(dāng)你到一座旅游城市,不知道當(dāng)?shù)赜惺裁疵朗硶r(shí),AI推薦系統(tǒng)在手機(jī)上的本地生活平臺(tái)會(huì)為你列出當(dāng)?shù)厮忻朗常?/p>
當(dāng)你在線上購(gòu)物,不知道時(shí)下有哪些新款式衣服時(shí),AI推薦系統(tǒng)在電商平臺(tái)上又會(huì)為你列出應(yīng)季又適合你的衣服。
對(duì)于企業(yè)而言,AI推薦系統(tǒng)更為重要,在浩渺的商業(yè)世界里,AI推薦系統(tǒng)就像一條秩序鏈,通過(guò)這條秩序鏈,數(shù)以千萬(wàn)計(jì)的企業(yè)得以找到分布在全球各地最需要他們產(chǎn)品的用戶。
上海市人工智能行業(yè)協(xié)會(huì)秘書(shū)長(zhǎng)鐘俊浩指出:“隨著人工智能技術(shù)的迅速發(fā)展及軟硬件進(jìn)步,我們正步入一個(gè)AI技術(shù)廣泛應(yīng)用并深刻影響各行各業(yè)的新時(shí)代,與此同時(shí),如今電商、個(gè)性化廣告等諸多商業(yè)場(chǎng)景背后都在以AI推薦系統(tǒng)作為依托,AI推薦系統(tǒng)已經(jīng)是人工智能技術(shù)在商業(yè)領(lǐng)域最為成熟的應(yīng)用之一。”
數(shù)字營(yíng)銷(xiāo)就是使用了AI推薦系統(tǒng)的一個(gè)主要場(chǎng)景, 作為國(guó)內(nèi)領(lǐng)先的商業(yè)數(shù)字營(yíng)銷(xiāo)平臺(tái),阿里媽媽就在用AI推薦系統(tǒng)為企業(yè)提供全鏈路的營(yíng)銷(xiāo)解決方案。
阿里媽媽的使命是“讓天下沒(méi)有難做的營(yíng)銷(xiāo)”,通過(guò)自研的數(shù)字營(yíng)銷(xiāo)平臺(tái),阿里媽媽每年都在為各行各業(yè)的商家和品牌解決一系列營(yíng)銷(xiāo)和廣告投放問(wèn)題,通過(guò)精準(zhǔn)營(yíng)銷(xiāo)幫助商家將產(chǎn)品推廣到最需要他們的消費(fèi)者面前,從而幫助企業(yè)實(shí)現(xiàn)他們應(yīng)有的價(jià)值。
為了將海量商品與消費(fèi)者進(jìn)行更加精準(zhǔn)的匹配,阿里媽媽的AI推薦算法和模型在過(guò)往幾年里一直在不斷升級(jí)迭代,與此同時(shí),日益復(fù)雜的AI模型也使得AI推薦系統(tǒng)對(duì)硬件算力的需求越來(lái)越高。
“線上購(gòu)物已經(jīng)很普遍,實(shí)際上,每次用戶在線上瀏覽商品都會(huì)涉及百億量級(jí)的浮點(diǎn)運(yùn)算”,阿里媽媽軟件工程師劉征宇解釋稱。
由此帶來(lái)的是日益增長(zhǎng)的算力需求和有限算力供給之間的矛盾,這一矛盾也成了像阿里媽媽這樣基于人工智能技術(shù)開(kāi)展數(shù)字營(yíng)銷(xiāo)業(yè)務(wù)的企業(yè)的一大痛點(diǎn)。
要解決這一痛點(diǎn),最直接的方法就是增加AI算力、優(yōu)化AI算法。尤其是AI算力的提升,是數(shù)字營(yíng)銷(xiāo)業(yè)務(wù)不斷升級(jí)迭代最重要的保障。
是挑戰(zhàn)也是機(jī)遇,最適合的才是最好的
<iframe src="https://icon.zhiding.cn/swf/videoPlayer-new.html?Id=1951_4c6cba191ed082853f06c31ed021cc88&width=640&height=360" width="640" height="360" frameborder="0" data-mce-fragment="1"></iframe>
大模型的出現(xiàn),讓GPU呼聲越來(lái)越高,似乎GPU在一夜之間成了人工智能技術(shù)在算力上的唯一選擇。
其實(shí)不然,在數(shù)字營(yíng)銷(xiāo)這樣實(shí)際商業(yè)應(yīng)用場(chǎng)景中,GPU不僅不是唯一選擇,甚至也可能不是最優(yōu)解。
實(shí)際上,人工智能技術(shù)對(duì)于算力的強(qiáng)需求主要來(lái)自于AI訓(xùn)練和AI推理兩方面。而要想將人工智能技術(shù)轉(zhuǎn)化為各行各業(yè)的生產(chǎn)力,幫助各行各業(yè)提升生產(chǎn)效率,最關(guān)鍵的是AI推理。
鐘俊浩也做過(guò)解析:“在大模型深入產(chǎn)業(yè)的這一年里,越來(lái)越多行業(yè)開(kāi)始關(guān)注AI推理,而如何將CPU發(fā)揮到極致,加速AI推理,并推動(dòng)其產(chǎn)業(yè)落地就成了關(guān)鍵問(wèn)題。”
某些硬件廠商對(duì)于推薦系統(tǒng)、語(yǔ)音識(shí)別、圖像識(shí)別、基因測(cè)序這樣傳統(tǒng)的AI應(yīng)用,在CPU上已經(jīng)做了大量的優(yōu)化。特別是在執(zhí)行AI推理任務(wù)時(shí),經(jīng)過(guò)優(yōu)化的大模型在CPU上已經(jīng)可以實(shí)現(xiàn)高效執(zhí)行。
英特爾數(shù)據(jù)中心和人工智能集團(tuán)至強(qiáng)生態(tài)賦能事業(yè)部(中國(guó))總經(jīng)理李亞?wèn)|就指出:“當(dāng)模型很大,涉及到需要跨異構(gòu)平臺(tái)計(jì)算時(shí),使用CPU速度反而更快,效率也更高。”
2023年12月,英特爾在國(guó)內(nèi)正式發(fā)布了第五代至強(qiáng)<sup>®</sup> 可擴(kuò)展處理器,它從多方面提升了硬件算力,包括頻率,功耗,LLC緩存,內(nèi)存帶寬和延遲都有明顯的改進(jìn)。
最關(guān)鍵的是它內(nèi)置的英特爾<sup>®</sup> 高級(jí)矩陣擴(kuò)展(英特爾<sup>®</sup> AMX技術(shù)),特別針對(duì)深度學(xué)習(xí)模型最常見(jiàn)的矩陣乘法運(yùn)算優(yōu)化,支持BF16(訓(xùn)練/推理)和INT8(推理)等常見(jiàn)數(shù)據(jù)類(lèi)型。
英特爾<sup>®</sup> AMX位于每個(gè)CPU內(nèi)核上并靠近系統(tǒng)內(nèi)存,可減少數(shù)據(jù)傳輸延遲、提高數(shù)據(jù)傳輸帶寬,并且同步降低實(shí)際使用上的復(fù)雜性。
實(shí)際上,在目前AI推薦系統(tǒng)面臨的硬件算力挑戰(zhàn)中,CPU已經(jīng)成了解決AI推理計(jì)算需求的核心算力。
據(jù)劉征宇透露:“阿里媽媽在選擇以第五代英特爾<sup>®</sup> 至強(qiáng)<sup>®</sup> 可擴(kuò)展處理器作為算力平臺(tái),使用英特爾<sup>®</sup> AMX和AVX-512優(yōu)化后,針對(duì)廣告推薦模型,性能相比第四代至強(qiáng)<sup>®</sup> 可擴(kuò)展處理器有了明顯提升,在滿足SLA的前提下,吞吐量提升(達(dá))1.52倍。”
基于此,阿里媽媽通過(guò)不斷提升算力和優(yōu)化算法,使得整個(gè)營(yíng)銷(xiāo)鏈條更加絲滑,也更加智能高效。
除了硬件創(chuàng)新,英特爾在軟件方面也在持續(xù)發(fā)力,以確?,F(xiàn)有的AI框架和應(yīng)用能夠充分發(fā)揮出硬件潛力。
英特爾不僅持續(xù)為主流開(kāi)源框架PyTorch、TensorFlow等貢獻(xiàn)力量,還提供了多種針對(duì)CPU平臺(tái)的優(yōu)化插件,如IPEX(Intel<sup>®</sup> Extension for PyTorch)、ITEX(Intel<sup>®</sup> Extension for TensorFlow)等,同時(shí)提供了諸如xFT(xFasterTransformer)、OpenVINO™ 工具套件等多種優(yōu)化工具。
“最適合的,才是最好的,我們現(xiàn)在最需要的不是無(wú)限高的算力,而是擁有足夠算力的超能戰(zhàn)士。”劉征宇進(jìn)一步解釋稱。
同樣, CPU平臺(tái)廣泛部署、易于獲取,便于應(yīng)用和優(yōu)化,能兼顧通用計(jì)算又能做推理加速,且不用為此導(dǎo)入異構(gòu)帶來(lái)的各種復(fù)雜性,自然就會(huì)收獲高效的應(yīng)用表現(xiàn)、落地速度和更強(qiáng)的成本競(jìng)爭(zhēng)力。
以阿里媽媽所在的數(shù)字營(yíng)銷(xiāo)應(yīng)用場(chǎng)景為例,無(wú)論是矩陣乘法這樣計(jì)算密集型的AI運(yùn)算,還是數(shù)據(jù)查詢這樣訪存密集型的AI運(yùn)算,都離不開(kāi)CPU的參與。
即便是在CPU-GPU協(xié)同應(yīng)用場(chǎng)景中,GPU這樣協(xié)處理器的算力發(fā)揮作用,也非常依賴CPU的處理速度。
用CPU加速AI落地,未來(lái)可期,大有可為
如果說(shuō)2023年是大模型技術(shù)爆發(fā)的一年,那么,2024年就是大模型深入產(chǎn)業(yè)應(yīng)用的關(guān)鍵年。不論是大模型還是傳統(tǒng)的AI技術(shù),要想得到落地,做到“快、好、省”才是關(guān)鍵。
CPU能確保整個(gè)系統(tǒng)的穩(wěn)定運(yùn)行、各組件的高效通信協(xié)作,并最終推進(jìn)任務(wù)的順利執(zhí)行。
除了熱門(mén)的AI推理和訓(xùn)練,一條AI流水線中還包括數(shù)據(jù)預(yù)處理、后處理等可能需要CPU通用處理能力的環(huán)節(jié)。在這些環(huán)節(jié)中,CPU具備的通用性和靈活性,能夠適應(yīng)各種不同的計(jì)算場(chǎng)景,適應(yīng)廣泛的應(yīng)用需求。
第五代至強(qiáng)<sup>®</sup> 可擴(kuò)展處理器充分考慮到這些需求,內(nèi)置了諸如英特爾<sup>®</sup> 數(shù)據(jù)流加速器(英特爾<sup>®</sup> DSA)來(lái)主攻數(shù)據(jù)存儲(chǔ)與傳輸;英特爾<sup>®</sup> 存內(nèi)分析加速器 (英特爾<sup>®</sup> IAA)來(lái)針對(duì)數(shù)據(jù)庫(kù)和數(shù)據(jù)分析加速;英特爾<sup>®</sup> 數(shù)據(jù)保護(hù)與壓縮加速技術(shù)(英特爾<sup>®</sup> QAT)來(lái)加速數(shù)據(jù)壓縮、對(duì)稱和非對(duì)稱數(shù)據(jù)加密解密,提高CPU效率和整體系統(tǒng)性能。
李亞?wèn)|還指出:“從企業(yè)長(zhǎng)遠(yuǎn)發(fā)展來(lái)看,CPU在穩(wěn)定性、安全性等方面的表現(xiàn)值得信賴,這對(duì)于保護(hù)企業(yè)數(shù)據(jù)和客戶隱私至關(guān)重要。第五代至強(qiáng)<sup>®</sup> 可擴(kuò)展處理器內(nèi)置的英特爾<sup>®</sup> SGX和TDX,可以為企業(yè)分別提供更強(qiáng)、更易用的應(yīng)用隔離能力和虛擬機(jī)層面的隔離和保密性,為現(xiàn)有應(yīng)用提供了一條更簡(jiǎn)便的向可信執(zhí)行環(huán)境遷移的路徑。”
未來(lái)英特爾數(shù)據(jù)中心產(chǎn)品組合,預(yù)計(jì)可以覆蓋通用計(jì)算與AI加速,實(shí)現(xiàn)從數(shù)據(jù)預(yù)處理、到模型訓(xùn)練與優(yōu)化,再到部署與推理的AI“全管線”加速。
CPU不僅是老伙伴,還是新變量,隨著新一代CPU在各方面性能的不斷提升,CPU也正在成為為千行萬(wàn)業(yè)企業(yè)智能化轉(zhuǎn)型提供源源不斷動(dòng)力的心臟。
正如鐘俊浩所說(shuō):“持續(xù)創(chuàng)新和進(jìn)化的CPU,在全新技術(shù)周期下,成為一代又一代科學(xué)家留給新時(shí)代最好的禮物。”
申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!
凌晨?jī)牲c(diǎn),小王合上筆記本,揉了揉酸脹的眼睛?;艘粋€(gè)月寫(xiě)出來(lái)的10萬(wàn)字短劇劇本躺在硬盤(pán)里,要真正把它拍成劇,得找演員、租場(chǎng)地、請(qǐng)攝像、做后期……粗算下來(lái)少說(shuō)要幾十萬(wàn),他只能把劇本繼續(xù)鎖在抽屜里。不過(guò),現(xiàn)在小王的劇本可以“見(jiàn)光”了。2026年3月19日,字節(jié)跳動(dòng)旗下的小云雀AI正式上線了短劇Agent
你一定遇到過(guò)這樣的場(chǎng)景:明明剛和AI助手聊了半個(gè)小時(shí)的項(xiàng)目細(xì)節(jié),退出會(huì)話后重新打開(kāi),它卻像個(gè)失憶患者一樣,連你上一輪說(shuō)過(guò)什么背景信息都忘得一干二凈,你又得從頭把需求講一遍。這種“聊完就忘”的體驗(yàn),讓無(wú)數(shù)使用AI智能體的用戶深感頭疼。為了解決這一普遍困擾,騰訊云在4月3日正式推出了名為“龍蝦”的記憶服
4月3日凌晨,谷歌DeepMind悄然甩出一枚重磅炸彈——全新一代開(kāi)源大模型Gemma4正式發(fā)布,以極其寬松的Apache2.0協(xié)議向全球開(kāi)發(fā)者免費(fèi)開(kāi)放。這是自2025年3月發(fā)布Gemma3以來(lái),谷歌時(shí)隔整整一年的重大迭代。本次發(fā)布的Gemma4包含四個(gè)不同規(guī)格的版本:E2B(有效20億參數(shù))、E4
AI龍蝦也會(huì)生病。別怕,大部分病不是什么絕癥,自己在家就能治。我養(yǎng)OpenClaw一年多,總結(jié)出五種最常見(jiàn)的毛病,附上我的“土方子”,希望對(duì)你有用。病一:不吃食(完全不執(zhí)行任何任務(wù))癥狀:你給了指令,它沒(méi)反應(yīng),日志里一片空白。就像龍蝦趴在塘底不動(dòng)彈,碰它也不理。病因:通常是進(jìn)程卡死了,或者依賴服務(wù)沒(méi)
養(yǎng)過(guò)真龍蝦的人都知道,投喂是個(gè)技術(shù)活。喂少了,龍蝦餓得互相殘殺;喂多了,剩餌壞水,整塘發(fā)病。OpenClaw這個(gè)AI龍蝦也一樣——你給它安排的任務(wù)太少,它會(huì)“閑得發(fā)慌”,反應(yīng)遲鈍;你一次塞給它太多復(fù)雜任務(wù),它會(huì)“消化不良”,要么報(bào)錯(cuò)要么干一半就卡住。每天該喂幾次?我的經(jīng)驗(yàn)是:每天喂兩次,早上一次簡(jiǎn)單
養(yǎng)過(guò)真龍蝦的人都知道,苗種的好壞直接決定收成。養(yǎng)AI龍蝦也一樣——OpenClaw有不同版本,有的穩(wěn)定但功能少,有的功能多但愛(ài)“鬧脾氣”。新手該怎么選?我用自己的踩坑經(jīng)歷告訴你。版本怎么選?OpenClaw目前主要有三個(gè)分支:穩(wěn)定版(Stable)、測(cè)試版(Beta)和社區(qū)魔改版(Community
我第一次聽(tīng)說(shuō)OpenClaw,是在一個(gè)技術(shù)群里。有人發(fā)了一串代碼,說(shuō)“這個(gè)AI龍蝦特別好養(yǎng),會(huì)自己找食吃”。我好奇點(diǎn)進(jìn)去,結(jié)果對(duì)著終端發(fā)了一小時(shí)呆——連環(huán)境都沒(méi)搭起來(lái)。后來(lái)我才明白,養(yǎng)AI龍蝦跟養(yǎng)真龍蝦一樣,新手入門(mén)得先做足功課。第一問(wèn):我的電腦跑得動(dòng)嗎?很多人以為AI龍蝦就是個(gè)聊天機(jī)器人,打開(kāi)網(wǎng)頁(yè)
4月2日,字節(jié)跳動(dòng)旗下火山引擎在武漢舉行的AI創(chuàng)新巡展上宣布,Seedance2.0API正式面向企業(yè)用戶開(kāi)啟公測(cè)。同時(shí),火山引擎總裁譚待在會(huì)上披露,截至今年3月,豆包大模型日均Token使用量已突破120萬(wàn)億,在過(guò)去三個(gè)月內(nèi)增長(zhǎng)一倍,比2024年5月發(fā)布時(shí)增長(zhǎng)1000倍。Seedance2.0:從
養(yǎng)AI小龍蝦的路上,坑不少。有人被代裝服務(wù)騙了錢(qián),有人電腦中了毒,有人收到天價(jià)賬單,還有人發(fā)現(xiàn)AI“失控”了,開(kāi)始亂刪文件。如果你也遇到這些糟心事,別慌。下面這份“養(yǎng)蝦應(yīng)急包”,告訴你第一時(shí)間該做什么。場(chǎng)景一:代裝被騙,錢(qián)打水漂了花了300塊找人遠(yuǎn)程裝OpenClaw,結(jié)果對(duì)方收了錢(qián)就拉黑,或者裝了
把AI智能體請(qǐng)進(jìn)電腦,就像把家里所有的鑰匙交給了一個(gè)陌生人。它能幫你打掃房間、整理文件,但萬(wàn)一它“起了壞心”,或者被壞人利用了,你的家就不再安全了。這不是危言聳聽(tīng)。國(guó)家互聯(lián)網(wǎng)應(yīng)急中心已經(jīng)發(fā)布風(fēng)險(xiǎn)提示,指出OpenClaw的默認(rèn)配置“極為脆弱”,攻擊者一旦得手,能輕易獲取系統(tǒng)控制權(quán)。微軟安全團(tuán)隊(duì)也警告