百度自主研發(fā)的百度昆侖芯片,正在為新基建提供可靠動力。9月15日,“萬物智能——百度世界2020”大會召開。主論壇上,百度創(chuàng)始人、董事長兼CEO李彥宏與百度各業(yè)務板塊領軍人物用一場新潮且極客的線上直播發(fā)布會形式,全方位展示了百度人工智能的最新成果,并與各界共同探討了人工智能、新基建、智能經(jīng)濟等熱點話題,在整個行業(yè)引發(fā)萬眾矚目。
在當天下午的百度大腦分論壇上,百度智能芯片總經(jīng)理歐陽劍系統(tǒng)的講解了基礎層芯片10年來的技術積累及最新進展:百度昆侖1已量產(chǎn),已在百度搜索引擎及云計算用戶部署2萬片,相比T4 GPU 性能在不同模型下提升1.5-3倍;同時預發(fā)布了采用7nm 先進工藝的百度昆侖2,性能比百度昆侖1 提升3倍,2021年上半年量產(chǎn)等重要內(nèi)容。
(百度智能芯片總經(jīng)理歐陽劍)
會上,歐陽劍首先介紹了AI芯片的發(fā)展背景。他講到,每個IT發(fā)展的階段都有非常獨特的芯片處理器架構:大型機、小型機的時代,芯片的架構是定制的處理器;PC+互聯(lián)網(wǎng)時代,X86CPU處理器為占據(jù)主場;移動+云的時代,處理器的架構變成ARM CPU與X86CPU共存,其中ARM CPU占領移動端,X86CPU占領了服務器端;AI+智能云時代,出現(xiàn)了全新的芯片架構——AI芯片。
百度研發(fā)AI芯片的積累得益于其用FPGA做AI加速的積累,也得益于其在軟件定義加速器和XPU架構的多年積累。據(jù)悉,百度最早在2010年開始用FPGA做AI架構的研發(fā),2011年開展小規(guī)模部署上線,2017年部署超過了1萬片F(xiàn)PGA,2018年發(fā)布自主研發(fā)AI芯片,2019年下半年流片成功,2020年開始量產(chǎn),以及預計2021年第二代百度昆侖量產(chǎn)。同時,百度昆侖團隊還在業(yè)界最頂級的芯片會議Hotchips上發(fā)表了4篇論文,是目前國內(nèi)發(fā)表最多的。
歐陽劍強調(diào),AI芯片是科技競爭的制高點,只有通用的AI處理器才可以在激烈的競爭中勝出。而百度昆侖核心產(chǎn)品的定位正是通用AI處理器,目標是提供高性能、低成本、高靈活性的AI芯片。值得一提的是,百度昆侖芯片使得百度大腦具備了更完備的軟硬一體化能力,形成了從芯片到深度學習框架、平臺、生態(tài)的 AI 全棧技術布局。
百度昆侖-通用AI處理器具備的三個特點可以概括為:高性能、低成本、靈活性。首選通用性,是指其可以支持全部的AI應用及場景;其次易編程,可構建強大的軟件生態(tài)護城河;第三高性能,可支撐AI應用突破新可能;第四是低成本,而最重要的是自主可控。
為了更加直觀的展示百度昆侖芯片的實際性能,在今天的分享中,歐陽劍還給出了一系列百度昆侖對比T4的數(shù)據(jù)。例如:百度昆侖芯片可以實測到200多TOPS的實際的性能,對比業(yè)界最先進的T4的GPU 可實測到70左右的TOPS,百度昆侖相比T4有3倍的性能提升;而在圖像分割YOLOV3算法中,百度昆侖性能大概是T4的2倍。除此之外,還展示了百度昆侖在工業(yè)智能設備中的應用。
可以見得,百度昆侖芯片不僅具備高性能優(yōu)勢,其實際模型的性能也是業(yè)界最領先的。截止目前,百度昆侖芯片全面支持語音、圖像、NLP模型,靈活支持用戶自定義模型,支持傳統(tǒng)機器學習模型;100%自主芯片的設計,可以實現(xiàn)和國產(chǎn)處理器,國產(chǎn)OS,國產(chǎn)框架的完成適配;同時其也是國內(nèi)業(yè)界最大部署規(guī)模,并有超過10+個外部客戶。
會議的最后,歐陽劍還預發(fā)布了采用7nm先進工藝的百度昆侖第二代芯片,相對百度昆侖第一代芯片而言,性能提高了3倍,同時此款芯片還帶有高速片間互聯(lián),多款細分型號,覆蓋云訓練、云推理以及邊緣計算等優(yōu)勢。
目前,百度已經(jīng)成為中國AI芯片界的重量級玩家,對于中國強化底層技術特別是芯片技術有重要意義。隨著人工智能、新基建的發(fā)展,百度表示將在AI芯片領域繼續(xù)長期投入研究,以更好的落實“軟硬一體化”發(fā)展的戰(zhàn)略目標,加速產(chǎn)業(yè)智能化發(fā)展步伐。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!