WAVE SUMMIT 2022深度學(xué)習(xí)開發(fā)者峰會(huì)上周圓滿落幕,來自產(chǎn)學(xué)研界的專家學(xué)者和資深A(yù)I工程師在七大平行論壇帶來了精彩的技術(shù)分享。 本次峰會(huì)專設(shè)【智能硬核 生態(tài)共創(chuàng)】平行論壇,昆侖芯科技生物計(jì)算研發(fā)總監(jiān)鄭煥鑫受邀參會(huì),并進(jìn)行“昆侖芯×飛槳:共創(chuàng)智能計(jì)算‘芯’生態(tài)”的主題演講 。
昆侖芯適配百度飛槳等主流框架,支持推理和訓(xùn)練場景,生態(tài)建設(shè)正在逐漸完備,已在豐富的業(yè)務(wù)場景落地。作為國內(nèi)人工智能芯片領(lǐng)域的先行者,昆侖芯科技依托團(tuán)隊(duì)多年耕耘芯片和智能計(jì)算領(lǐng)域的行業(yè)影響力,致力于攜手上下游合作伙伴,打造智能計(jì)算“芯”生態(tài)。
以下內(nèi)容來自演講實(shí)錄:
大家好,我是來自昆侖芯科技的鄭煥鑫。
昆侖芯科技是一家AI芯片公司,2021年4月完成了獨(dú)立融資,首輪估值約130億元。公司前身是百度智能芯片及架構(gòu)部,在實(shí)際業(yè)務(wù)場景中深耕AI加速領(lǐng)域已十余年,是一家在體系結(jié)構(gòu)、芯片實(shí)現(xiàn)、軟件系統(tǒng)和場景應(yīng)用均有深厚積累的AI芯片企業(yè)。
昆侖芯科技研發(fā)實(shí)力雄厚,團(tuán)隊(duì)成員擁有全球頂尖學(xué)術(shù)背景,并提出了100%自研的通用AI計(jì)算處理器核心架構(gòu)昆侖芯XPU,研究成果也在Hot Chips、ISSCC等國際頂級(jí)學(xué)術(shù)會(huì)議中成功發(fā)表。
在落地實(shí)現(xiàn)上,昆侖芯1代在百度搜索引擎、小度等業(yè)務(wù)中部署超過2萬片,是國內(nèi)唯一一款經(jīng)歷過互聯(lián)網(wǎng)大規(guī)模核心算法考驗(yàn)的云端AI芯片產(chǎn)品。昆侖芯2代采用7nm制程,也已于2021年8月量產(chǎn)。更先進(jìn)的昆侖芯3代、自動(dòng)駕駛芯片等多個(gè)產(chǎn)品均已啟動(dòng)研發(fā)。
隨著AI越來越普及,其依托的算力需求也越來越大。在這個(gè)時(shí)代背景下,昆侖芯的愿景是“成為劃時(shí)代,全球領(lǐng)先的智能計(jì)算公司”,為AI發(fā)展提供算力賦能。
昆侖芯在AI芯片上經(jīng)歷了超過10年的發(fā)展歷程。我們?cè)?011年啟動(dòng)FPGA AI加速器項(xiàng)目,到2015年部署5000片,2017年部署超過12000片,是業(yè)界最大的量;2017年發(fā)布自研架構(gòu)昆侖芯XPU;2018年啟動(dòng)昆侖芯;2020年昆侖芯1代大規(guī)模部署;2021年昆侖芯2代量產(chǎn)。

昆侖芯軟硬件架構(gòu)及兩代產(chǎn)品
不同于GPU的發(fā)展歷程,昆侖芯1代在AI發(fā)展相對(duì)成熟的時(shí)候量產(chǎn),在設(shè)計(jì)階段就更好地理解了AI場景,提供了更多的加速計(jì)算單元,并且保留了足夠的通用計(jì)算單元,最終達(dá)到了更好的性價(jià)比。
這是我們的昆侖芯XPU架構(gòu):SDNN-軟件定義神經(jīng)網(wǎng)絡(luò)引擎,是我們自研的核心張量計(jì)算單元,用于加速卷積和矩陣乘法;Cluster為我們的通用計(jì)算部件;我們也是國內(nèi)業(yè)界率先支持GDDR6的廠商之一;我們的Shared Memory片上共享內(nèi)存,有力保證了計(jì)算單元的高并發(fā)、低時(shí)延訪問;提供高達(dá)200GB/s的片間互聯(lián)帶寬,有效提升了大規(guī)模分布式訓(xùn)練中的數(shù)據(jù)傳輸效率,減少通訊延時(shí);支持PCIe第四代接口,雙向帶寬可達(dá)到64GB/s。

這是我們的軟件架構(gòu)圖:在應(yīng)用層,我們支持訓(xùn)練、推理以及科學(xué)計(jì)算;在框架層,除了深度合作的PaddlePaddle,還支持TensorFlow,PyTorch等;我們提供了豐富的SDK,包括編輯器、圖引擎、高性能算子庫、高性能通訊庫,以及驅(qū)動(dòng);在環(huán)境部署上,我們支持公有云服務(wù)、智算中心、智能邊緣設(shè)備等。

這是我們的產(chǎn)品研發(fā)路線,昆侖芯1代采用14nm工藝,昆侖芯2代采用7nm工藝,此外我們的昆侖芯3代、昆侖芯4代都在研發(fā)路徑中。

昆侖芯1代產(chǎn)品包括兩種形式,其中K100是K200的算力一半版本,主要用在邊緣端。昆侖芯2代產(chǎn)品中,R200 AI加速卡主要用于推理,支持INT8/INT16/INT32/FP16/FP32等精度,非常值得一提的是昆侖芯R200 AI加速卡支持視頻編解碼能力;R480-X8 AI加速器組是我們的單機(jī)8卡訓(xùn)練方案,提供200GB/s的片間互聯(lián)帶寬。
概括起來,昆侖芯2代有如下特點(diǎn):
1.通用計(jì)算能力顯著增強(qiáng),可靈活支持AI算法的演進(jìn),提升資源投入效用;
2.硬件虛擬化,提升AI算力資源的利用率;
3.高性能分布式AI系統(tǒng),加速AI數(shù)據(jù)并行和模型并行中的高速數(shù)據(jù)交換。
介紹完硬件參數(shù),我們看看昆侖芯的軟件參數(shù)。以R200 AI加速卡為例,相比較于業(yè)界主流產(chǎn)品,典型AI負(fù)載性能提升1.5倍左右,其中GEMM矩陣乘法性能為1.7倍,BERT典型自然語言處理性能加速比為1.4倍。對(duì)Transformer類有同樣的效果;Yolov3,Yolov5性能加速1.3倍;ResNet50視覺分類算法加速1.2倍。
昆侖芯AI算力賦能千行百業(yè)
昆侖芯科技前身為百度智能芯片及架構(gòu)部,天然對(duì)互聯(lián)網(wǎng)AI應(yīng)用有深入了解。以百度搜索場景為例,我們實(shí)現(xiàn)了過萬片的部署,與飛槳聯(lián)合優(yōu)化模型:DeepFM、Wide&Deep。此外,我們?cè)诎ò俣仍趦?nèi)的多家互聯(lián)網(wǎng)公司上均有不錯(cuò)的落地表現(xiàn)
在智能城市領(lǐng)域,萬級(jí)別攝像機(jī)收集視頻流,通過芯片編解碼獲取圖片,對(duì)圖片進(jìn)行人臉檢索以及比對(duì)。該場景主要是以CV類算法為主,我們和飛槳聯(lián)合優(yōu)化模型包括:ResNet50、MobileNet-v3、Unet、Yolov3-DarkNet53、SSD-ResNet34 。
工業(yè)質(zhì)檢場景,高清工業(yè)相機(jī)拍攝零件照片進(jìn)行質(zhì)量檢測。搭載國產(chǎn)AI算力機(jī)的質(zhì)檢設(shè)備替代人工質(zhì)檢,大大節(jié)省了人力,14個(gè)月即可收回成本。同時(shí),“5G+AI+工業(yè)互聯(lián)網(wǎng)”解決方案大大提高了整廠的智能化水平,幫助企業(yè)降低損耗,提升約10%的良品率。在這個(gè)方向上,我們和飛槳聯(lián)合開發(fā)了Yolov3-DarkNet53、SSD-ResNet34。
在目前國內(nèi)前沿的生物計(jì)算領(lǐng)域,我們也對(duì)基因測序算法Blast以及蛋白質(zhì)折疊預(yù)測算法進(jìn)行了硬件適配,并取得了不錯(cuò)的加速比。
綜上,我們?cè)诨ヂ?lián)網(wǎng)、智慧城市、智慧工業(yè)、生物計(jì)算、智慧金融、智慧政務(wù)、智算中心以及智慧交通等各行業(yè) AI 應(yīng)用落地場景中均提供了多種解決方案。
總結(jié)來看,昆侖芯科技最獨(dú)特優(yōu)勢在于:在百度搜索引擎、小度等業(yè)務(wù)中部署超過2萬片,是國內(nèi)唯一一款經(jīng)歷了互聯(lián)網(wǎng)大規(guī)模核心算法考驗(yàn)的云端AI芯片,產(chǎn)品的可用性、可靠性、穩(wěn)定性、魯棒性得到了驗(yàn)證,也證明了團(tuán)隊(duì)在芯片架構(gòu)、軟件棧、工程化系統(tǒng)層級(jí)的技術(shù)實(shí)力。此外,昆侖芯靈活支持多個(gè)AI場景,如視覺、語音、NLP和推薦等;不僅如此,昆侖芯也支持HPC、生物計(jì)算等算法的加速。
申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!
在信息技術(shù)持續(xù)革新與市場競爭日趨激烈的行業(yè)環(huán)境下,本地生活服務(wù)領(lǐng)域正經(jīng)歷著深刻的智能化轉(zhuǎn)型。這一轉(zhuǎn)型過程不僅涉及技術(shù)層面的升級(jí)迭代,更關(guān)乎服務(wù)模式與行業(yè)生態(tài)的系統(tǒng)性重構(gòu)。閱北科技通過持續(xù)推進(jìn)算法技術(shù)的優(yōu)化與應(yīng)用,在提升服務(wù)精準(zhǔn)度和用戶滿意度方面進(jìn)行了積極探索。閱北的算法系統(tǒng)建立在持續(xù)優(yōu)化的技術(shù)架構(gòu)之
2025年10月17日,上海在人工智能技術(shù)加速演進(jìn)、產(chǎn)業(yè)生態(tài)持續(xù)升級(jí)的關(guān)鍵時(shí)期,由上海市漕河涇新興技術(shù)開發(fā)區(qū)發(fā)展總公司聯(lián)合天罡智算交易平臺(tái)共同發(fā)起成立的“漕河涇天罡人工智能研究院”(以下簡稱“研究院”)正式揭牌。研究院將依托漕河涇的產(chǎn)業(yè)資源與平臺(tái)優(yōu)勢,聯(lián)合上海交通大學(xué)、上海社會(huì)科學(xué)院等權(quán)威機(jī)構(gòu),聚焦
以“智能時(shí)代同球共濟(jì)”為主題的2025世界人工智能大會(huì)在上海正式開幕。
“AI大模型六小虎”百川智能危機(jī)重重。這是前搜狗CEO王小川創(chuàng)辦的AI公司。昨天就爆出新聞,百川智能的聯(lián)合創(chuàng)始人離職,這是王小川入局AI的第一道大坎。接下的成敗非常關(guān)鍵:(1)拿下河北(2)學(xué)習(xí)科大訊飛百川智能離職高端概覽:(1)2025年7月10日,百川智能技術(shù)聯(lián)合創(chuàng)始人謝劍將離職。他是百川只能的
人工智能作為引領(lǐng)新一輪科技革命和產(chǎn)業(yè)變革的戰(zhàn)略性技術(shù),正在加速融入千行百業(yè),便利千家萬戶。
文/楊雪健來源/節(jié)點(diǎn)財(cái)經(jīng)Meta或迎來史上最大規(guī)模裁員潮。2026年3月14日,路透社曝出Meta正計(jì)劃啟動(dòng)新一輪大規(guī)模裁員,此次裁員比例或達(dá)公司總員工數(shù)的20%,按其近7.9萬的員工規(guī)模計(jì)算,約1.58萬名員工或?qū)⒈徊谩H粼撚?jì)劃執(zhí)行,將成為Meta自2022年底實(shí)行“效率之年”重組后規(guī)模最大的一次
3月17日,阿里發(fā)布全球首個(gè)企業(yè)級(jí)AI原生工作平臺(tái)——“悟空”,讓每個(gè)團(tuán)隊(duì)、每家公司,都能擁有一支24h工作的”龍蝦軍團(tuán)”。悟空是一款獨(dú)立應(yīng)用,即日起開啟邀測,也將直接內(nèi)置到超2000萬企業(yè)組織的釘釘之中。擁有8億用戶的釘釘重寫底層代碼,進(jìn)行全面CLI(命令行界面)化改造,讓悟空Agent能夠原生操
AI的“免費(fèi)紅利期”結(jié)束了,未來18個(gè)月,靠“API倒賣”的公司,會(huì)成片消失。這個(gè)導(dǎo)火索就是最近Google的一輪封號(hào)導(dǎo)致的,隨著封號(hào)風(fēng)波的結(jié)束,這也標(biāo)志著AI行業(yè)【收租時(shí)代】來了。2月封號(hào)潮:高付費(fèi)用戶被一鍋端一周前,Google開始大規(guī)模封號(hào),付著250美金月費(fèi)的人,賬號(hào)說沒就沒,Gmail、Y
來自路透社等媒體報(bào)道的最新消息:DeepSeek未發(fā)布的V4Lite模型遭泄露上網(wǎng),華為獲得早期訪問權(quán)限,英偉達(dá)被排除在外。近期,谷歌發(fā)表了2篇Multi-Agent協(xié)作學(xué)習(xí)新論文有網(wǎng)友提供了更加詳細(xì)的信息,DeepSeekV4Lite:100萬token上下文窗口(V3為128K)內(nèi)置原生多模態(tài)推
春節(jié)紅包會(huì)結(jié)束,但AI已融入數(shù)億人生活里
性能、商業(yè)、生態(tài)詮釋開源模型的最佳姿態(tài)
2026年剛開年,全世界最狂的那個(gè)男人,穿著他的經(jīng)典黑皮衣,在CES舞臺(tái)上發(fā)出了未來十年的信號(hào)。他搞了個(gè)“能吃飽套餐”:6個(gè)包子+一碟小菜+一碗粥=肉包子套餐,這樣以后你只要買一個(gè)套餐就能吃飽了。(Rubin平臺(tái))同時(shí)他們店里還免費(fèi)提供的筷子、勺子、蘸料、醬油、醋、水果、零食等等。(開放10萬億語言
12月12日-14日,2025全球開發(fā)者先鋒大會(huì)暨國際具身智能技能大賽(GDPS2025)于上海張江科學(xué)會(huì)堂舉行,大會(huì)以具身智能競技為核心,融合了技術(shù)比拼、產(chǎn)業(yè)展示與科普體驗(yàn),為全球觀眾呈現(xiàn)出具身智能的現(xiàn)在與未來。上海開普勒機(jī)器人有限公司(以下簡稱"開普勒機(jī)器人")攜明星產(chǎn)品K2"大黃蜂"亮相,并參
在數(shù)字化與智能化深度交織的時(shí)代浪潮中,安全的邊界不斷延展,技術(shù)的演進(jìn)正引領(lǐng)產(chǎn)業(yè)邁向新一輪變革。10月24日,以“弈動(dòng)Dynamic·數(shù)智躍遷博弈無界”為主題的2025TechWorld智慧安全大會(huì)在北京盛大召開。來自國家部委、院士學(xué)者、高??蒲袡C(jī)構(gòu)和企業(yè)的權(quán)威專家與業(yè)界精英齊聚北京,共議AI安全、數(shù)
2025年10月25日,2025世界青年科學(xué)家峰會(huì)之人工智能(AI)融合創(chuàng)新發(fā)展論壇在浙江溫州成功舉辦。本次論壇由國際院士科創(chuàng)中心主辦,中國投資協(xié)會(huì)能源投資專業(yè)委員會(huì)、溫港院士科創(chuàng)中心承辦,中國電工技術(shù)學(xué)會(huì)、中科先進(jìn)技術(shù)溫州研究院與溫州市電力工程學(xué)會(huì)提供支持,以“甌江論道-AI賦能綠色發(fā)展”為主題,