近年來,隨著大數(shù)據(jù)技術(shù)的發(fā)展,社交網(wǎng)絡(luò)、交易網(wǎng)絡(luò)、知識圖譜等圖數(shù)據(jù)也得以大量積累,從而有力的推動了圖數(shù)據(jù)的應(yīng)用。目前,圖數(shù)據(jù)已經(jīng)被成功應(yīng)用于包括金融風(fēng)控、推薦、工業(yè)流程控制、設(shè)備管理等許多領(lǐng)域。圖數(shù)據(jù)庫作為管理圖數(shù)據(jù)的基礎(chǔ)軟件,也吸引了許多廠商的注意。近年來,包括Oracle、IBM、微軟在內(nèi)的傳統(tǒng)軟件巨頭及眾多初創(chuàng)企業(yè)都大舉進軍圖數(shù)據(jù)庫領(lǐng)域。
北京費馬科技有限公司是一家以研發(fā)圖數(shù)據(jù)庫和圖計算軟件為目標的初創(chuàng)企業(yè)。在此前36氪的報道中,我們注意到這家由多名清華博士創(chuàng)辦的公司對圖計算技術(shù)有深厚的積累。今天我們欣喜地看到,費馬科技的圖數(shù)據(jù)庫TuGraph取得了突破,在國內(nèi)企業(yè)中率先通過了國際基準官方審計測試并取得了國際領(lǐng)先的測試結(jié)果。
2020年7月30日,費馬科技宣布,公司成為國內(nèi)第一家通過圖數(shù)據(jù)庫國際標準基準測試程序LDBC-SNB官方審計測試的企業(yè),同時打破了LDBC-SNB已經(jīng)公布的最高紀錄。在中大規(guī)模數(shù)據(jù)集(300GB)上,吞吐率達到之前最高紀錄(由Virtuoso保持)的7.6倍。
圖1. 審計測試成功的聲明頁截圖(含認證審計員,LDBC SNB任務(wù)組主任和費馬科技CTO的簽名)
讀者可以通過以下鏈接訪問LDBC官網(wǎng)上的正式公布的測試結(jié)果,并下載測試報告、程序、說明文檔以及軟硬件信息等。
LDBC SNB官方網(wǎng)站 : http://ldbcouncil.org/benchmarks/snb
測試報告下載: http://ldbcouncil.org/sites/default/files/LDBC_SNB_I_20200726_SF30-100-300_tugraph.pdf
關(guān)于LDBC和LDBC-SNB測試:
1.關(guān)聯(lián)數(shù)據(jù)基準委員會(LDBC,Linked Data Benchmark Council)是由Oracle、Intel等軟硬件巨頭和主流圖數(shù)據(jù)庫廠商NeoTechnology和TigerGraph等組成的非贏利機構(gòu),是圖(Graph)和RDF數(shù)據(jù)管理的基準指南制定者與測試結(jié)果發(fā)布機構(gòu)。
2.社交網(wǎng)絡(luò)基準測試(SNB,Social Network Benchmark)是由關(guān)聯(lián)數(shù)據(jù)基準委員會(LDBC)開發(fā)的面向圖數(shù)據(jù)庫的基準測試(Benchmark)之一,分為交互式查詢(Interactive)和商業(yè)智能(BI)兩個場景。本次費馬公司測試了其中的交互式查詢場景,主要考察系統(tǒng)在并發(fā)情況下的更新和交互式查詢吞吐率。 與很多廠商采用的基于單項測試的評測方式相比,LDBC-SNB(Interactive)更接近真實場景并對數(shù)據(jù)庫系統(tǒng)的并發(fā)執(zhí)行性能和事務(wù)處理能力進行了更具挑戰(zhàn)性的評測。
測試詳情
據(jù)公司創(chuàng)始人洪春濤介紹,本次測試采用LDBC SNB的30G(SF30)、100G(SF100)、300G(SF300)三個規(guī)模的數(shù)據(jù)集,其中300G數(shù)據(jù)集包含8億結(jié)點53億邊及相關(guān)屬性。查詢操作由7類簡單只讀查詢,14類復(fù)雜只讀查詢和8類事務(wù)類更新查詢按LDBC SNB Interactive測試規(guī)范規(guī)定的比例組合并發(fā)執(zhí)行,并以吞吐率為性能指標??梢钥吹?,TuGraph在數(shù)據(jù)量增大時仍能保持較高的性能,體現(xiàn)了其對大規(guī)模數(shù)據(jù)的良好支撐能力。
下表為不同數(shù)據(jù)規(guī)模下的測試結(jié)果,吞吐率(OPS)表示每秒完成的操作次數(shù)。
表1. 不同數(shù)據(jù)規(guī)模SF30(30GB),SF100(100GB)和SF300(300GB)的測試結(jié)果
CTO朱曉偉表示,公司在測試環(huán)境準備、測試數(shù)據(jù)生成和導(dǎo)入、測試例程序的安裝和執(zhí)行、結(jié)果正確性的驗證方面都嚴格遵守LDBC-SNB的規(guī)范。整個測試過程由LDBC認證的評估師在其租用的標準云系統(tǒng)上操作完成,并對測試代碼進行了詳細的評審。整個測試環(huán)境和測試過程均完整披露并可在LDBC網(wǎng)站上公開下載,保證了測試結(jié)果的可信性和公正性。
LDBC-SNB Interactive的主要測試要求包括:基準程序會通過多個客戶端并發(fā)地發(fā)送各類讀寫請求到服務(wù)器端,每個請求都有相應(yīng)的計劃時間,數(shù)據(jù)庫需要盡可能地使得所有操作都按計劃正常進行;一旦某個操作晚于計劃時間超過1秒以上則視作超時,如果超時比例大于5%則無法通過測試,對圖數(shù)據(jù)庫的更新和查詢性能提出了很高的要求;查詢分為7類簡單查詢和14類復(fù)雜查詢,每類復(fù)雜查詢在不同數(shù)據(jù)規(guī)模下根據(jù)其復(fù)雜度以不同的頻率混合在一起,簡單查詢則穿插在這些復(fù)雜查詢之間;8類更新操作中不少都涉及多個數(shù)據(jù)對象的更新,因此需要ACID事務(wù)的支持來保證操作的正確性,SNB規(guī)范要求隔離級別至少達到提交讀(Read Committed),并在審計過程中對ACID支持進行了特別的測試。
值得注意的是,在本次測試中,TuGraph的超時比例為0%,且SNB實現(xiàn)了最高的隔離級別可串行化(Serializable),說明TuGraph在提供了高級別的事務(wù)隔離保證的同時仍然獲得了低延遲和遠遠超過其它數(shù)據(jù)庫的吞吐率。
CTO朱曉偉表示,相比同類型的圖數(shù)據(jù)庫產(chǎn)品,TuGraph可以支持更大的數(shù)據(jù)量,提供更快的響應(yīng),支持更多的并發(fā)查詢,因此也更適應(yīng)大數(shù)據(jù)時代。TuGraph在系統(tǒng)的設(shè)計目標上圍繞實時圖數(shù)據(jù)分析的特點展開:一方面,絕大部分請求是在最新數(shù)據(jù)上的只讀查詢,因此存儲引擎需要面向讀優(yōu)化,并需要對其中一些查詢操作采用并行的方式進行處理;另一方面,數(shù)據(jù)庫需要在快速完成這些只讀查詢的同時處理源源不斷的數(shù)據(jù)更新,而這些修改請求可能來自多個客戶端,因此需要完善的事務(wù)支持,并需要盡可能地避免使用全局鎖導(dǎo)致并發(fā)度的降低。為此,TuGraph實現(xiàn)了多版本的存儲使得只讀事務(wù)可以無阻塞地進行,并且提供了樂觀和悲觀兩種模式的讀寫事務(wù),從而針對不同情形提供最優(yōu)化的事務(wù)管理,在并發(fā)度和讀寫效率間取得較好的權(quán)衡;針對復(fù)雜的分析任務(wù),提供了并行遍歷和迭代式圖計算的接口,通過多個線程的協(xié)同工作來保障任務(wù)不會超時并持續(xù)占用系統(tǒng)資源。除此之外,TuGraph提供了豐富的開發(fā)接口:不僅支持描述式的查詢語言O(shè)penCypher以方便用戶更快地上手和開發(fā)原型,還提供了過程式的核心API讓用戶可以通過存儲過程的方式對一些需要追求極致性能的場景進行加速;存儲過程支持開發(fā)效率較高的Python和執(zhí)行效率較高的C++,未來還將增加受眾較廣的Java作為開發(fā)語言;訪問上同時支持RESTful和RPC兩種方式供用戶選擇。這些豐富的選項使得用戶可以在開發(fā)和生產(chǎn)環(huán)境上根據(jù)各自不同的場景和需求靈活地選擇最適合的使用方式,在易用性和高效性兩方面取得更好的平衡。
關(guān)于費馬
根據(jù)36氪此前報道,費馬科技成立于2016年5月,擁有圖數(shù)據(jù)平臺(TuGraph,曾用名LightGraph)、圖分析平臺(PandaGraph)兩大產(chǎn)品。TuGraph的定位是高性能單機版圖數(shù)據(jù)庫,這也是目前市場占有率最高的產(chǎn)品類型。費馬科技基于創(chuàng)始團隊在圖計算領(lǐng)域積累的經(jīng)驗以及領(lǐng)先的科研成果,研發(fā)出的TuGraph具有高性能、大數(shù)據(jù)量以及穩(wěn)定易用的特點,因此被廣大客戶所信賴。目前,費馬科技的產(chǎn)品已經(jīng)被多個領(lǐng)域的頭部客戶所采用,包括京東數(shù)科、大型國有銀行及商業(yè)銀行等金融業(yè)客戶,以及國家電網(wǎng)、中國商飛、西門子等工業(yè)部門用戶。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!
日前,北京佳格天地科技有限公司與農(nóng)業(yè)農(nóng)村部大數(shù)據(jù)發(fā)展中心簽訂聯(lián)合實驗室協(xié)議。雙方將充分利用遙感、AI等技術(shù),以及人才隊伍、技術(shù)產(chǎn)品等優(yōu)質(zhì)資源,開展農(nóng)業(yè)農(nóng)村領(lǐng)域相關(guān)基礎(chǔ)模型、作物農(nóng)情遙感監(jiān)測產(chǎn)品及農(nóng)業(yè)氣象服務(wù)等方面的合作研究。
日前,2022世界數(shù)字農(nóng)業(yè)大會舉行。大會以“種鑄強芯,數(shù)領(lǐng)未來”為主題,開設(shè)多場數(shù)字農(nóng)業(yè)云端專題論壇,北京佳格天地科技有限公司受邀出席”農(nóng)業(yè)農(nóng)村大數(shù)據(jù)應(yīng)用論壇“,同與會嘉賓分享了農(nóng)業(yè)大數(shù)據(jù)的創(chuàng)新應(yīng)用。
毫無疑問,隨著以Kubernetes為代表的云原生技術(shù)得到廣泛應(yīng)用和普及,云原生數(shù)據(jù)量和重要性不斷提高,使得企業(yè)對云原生數(shù)據(jù)庫服務(wù)的需求日漸增長。
近期,由中國工業(yè)設(shè)計協(xié)會、中國技術(shù)交易所雙重指導(dǎo),UXPA中國主辦的2022年第六屆GXA好體驗獎評選結(jié)果揭曉,元年科技憑借元年數(shù)據(jù)智能管理平臺榮獲“最佳企業(yè)賦能獎”,該獎項旨在挖掘當(dāng)代杰出用戶體驗作品,表彰利用創(chuàng)新思維、堅持以用戶體驗為中心的企業(yè),填補了國內(nèi)專業(yè)級別用戶體驗社會化獎項的空白。
近日,秦淮數(shù)據(jù)集團位于馬來西亞柔佛州的秦淮數(shù)據(jù)馬來柔佛超大規(guī)模數(shù)據(jù)中心(以下簡稱“MY06”)一期盛大開園。從規(guī)劃、設(shè)計到建造,秦淮數(shù)據(jù)集團中國、新加坡、馬來西亞三地團隊緊密合作,共同完成馬來西亞最大的國際超大規(guī)模數(shù)據(jù)中心交付
把脈中國數(shù)據(jù)智能化
2023年,幾乎可以被定義為中國互聯(lián)網(wǎng)公司的“大模型元年”。ChatGPT的全球爆紅,徹底點燃國內(nèi)的大模型賽道,曾經(jīng)的“創(chuàng)業(yè)英雄”、如今的商業(yè)領(lǐng)袖們親自下場,接連發(fā)布生成式人工智能產(chǎn)品與大模型布局。大模型火了,沉寂許久的互聯(lián)網(wǎng)行業(yè)又有了新的“戰(zhàn)事”。同時,大模型的快速發(fā)展也改變了云市場的現(xiàn)狀,企業(yè)對
近日,數(shù)字化市場研究咨詢機構(gòu)愛分析發(fā)布了《2022愛分析·數(shù)據(jù)智能廠商全景報告》,愛分析從技術(shù)研發(fā)能力、服務(wù)客戶數(shù)量、收入規(guī)模等維度對廠商進行了全面專業(yè)的評估
2022年11月18日,首個國家級大數(shù)據(jù)產(chǎn)業(yè)創(chuàng)新賽事——2022第一屆中國大數(shù)據(jù)大賽圓滿落幕。工業(yè)和信息化部信息技術(shù)發(fā)展司數(shù)字經(jīng)濟推進處處長張建倫,中國電子技術(shù)標準化研究院副院長孫文龍出席頒獎典禮并致辭
2022年11月17日,在廈門市工業(yè)和信息化局的指導(dǎo)下,以“數(shù)據(jù)確權(quán)”為主題的2022數(shù)據(jù)資產(chǎn)(廈門)論壇在廈門成功舉辦。本次論壇以“數(shù)據(jù)確權(quán)”為主題,由廈門市互聯(lián)網(wǎng)域名應(yīng)用服務(wù)產(chǎn)業(yè)協(xié)會和構(gòu)信網(wǎng)(公信.中國)聯(lián)合主辦
近日,國內(nèi)知名數(shù)字化市場研究咨詢機構(gòu)愛分析正式發(fā)布《2022愛分析·信創(chuàng)廠商全景報告》(以下簡稱“報告”)。報告綜合考慮企業(yè)關(guān)注度、行業(yè)落地進展等因素,遴選出在信創(chuàng)市場中具備成熟解決方案和落地能力的廠商。
10月31日下午,由數(shù)博會執(zhí)委會主辦、數(shù)據(jù)觀(北京)傳媒科技有限公司承辦、貴陽大數(shù)據(jù)交易所協(xié)辦的第四期數(shù)博思享會“實踐先行觀公共數(shù)據(jù)價值與應(yīng)用”活動成功舉辦。
近日,由中國國際數(shù)字經(jīng)濟博覽會組委會主辦,中國電子技術(shù)標準化研究院、河北省工業(yè)和信息化廳承辦的“第一屆中國大數(shù)據(jù)大賽”(簡稱大數(shù)據(jù)大賽)正式啟動。
廣州光點信息科技有限公司自主研發(fā)的數(shù)據(jù)中臺產(chǎn)品GI大數(shù)據(jù)中臺V2.0產(chǎn)品是國內(nèi)率先推出符合新創(chuàng)標準的中臺產(chǎn)品,基于“大數(shù)據(jù)+AI”等技術(shù)全新打造,集數(shù)據(jù)采集、融合、治理、服務(wù)、管理為一體的旗艦平臺。
廣州光點信息科技有限公司自主研發(fā)的數(shù)據(jù)中臺產(chǎn)品GI大數(shù)據(jù)中臺V2.0產(chǎn)品是國內(nèi)率先推出符合新創(chuàng)標準的中臺產(chǎn)品,基于“大數(shù)據(jù)+AI”等技術(shù)全新打造,集數(shù)據(jù)采集、融合、治理、服務(wù)、管理為一體的旗艦平臺