1. 創(chuàng)業(yè)頭條
  2. 前沿領(lǐng)域
  3. 大數(shù)據(jù)
  4. 正文

國產(chǎn)圖數(shù)據(jù)庫廠商「費馬科技」通過LDBC-SNB官方審計測試,達到原紀錄的7.6倍

 2020-07-31 15:08  來源:互聯(lián)網(wǎng)  我來投稿 撤稿糾錯

  域名預(yù)訂/競價,好“米”不錯過

近年來,隨著大數(shù)據(jù)技術(shù)的發(fā)展,社交網(wǎng)絡(luò)、交易網(wǎng)絡(luò)、知識圖譜等圖數(shù)據(jù)也得以大量積累,從而有力的推動了圖數(shù)據(jù)的應(yīng)用。目前,圖數(shù)據(jù)已經(jīng)被成功應(yīng)用于包括金融風(fēng)控、推薦、工業(yè)流程控制、設(shè)備管理等許多領(lǐng)域。圖數(shù)據(jù)庫作為管理圖數(shù)據(jù)的基礎(chǔ)軟件,也吸引了許多廠商的注意。近年來,包括Oracle、IBM、微軟在內(nèi)的傳統(tǒng)軟件巨頭及眾多初創(chuàng)企業(yè)都大舉進軍圖數(shù)據(jù)庫領(lǐng)域。

北京費馬科技有限公司是一家以研發(fā)圖數(shù)據(jù)庫和圖計算軟件為目標的初創(chuàng)企業(yè)。在此前36氪的報道中,我們注意到這家由多名清華博士創(chuàng)辦的公司對圖計算技術(shù)有深厚的積累。今天我們欣喜地看到,費馬科技的圖數(shù)據(jù)庫TuGraph取得了突破,在國內(nèi)企業(yè)中率先通過了國際基準官方審計測試并取得了國際領(lǐng)先的測試結(jié)果。

2020年7月30日,費馬科技宣布,公司成為國內(nèi)第一家通過圖數(shù)據(jù)庫國際標準基準測試程序LDBC-SNB官方審計測試的企業(yè),同時打破了LDBC-SNB已經(jīng)公布的最高紀錄。在中大規(guī)模數(shù)據(jù)集(300GB)上,吞吐率達到之前最高紀錄(由Virtuoso保持)的7.6倍。

圖1. 審計測試成功的聲明頁截圖(含認證審計員,LDBC SNB任務(wù)組主任和費馬科技CTO的簽名)

讀者可以通過以下鏈接訪問LDBC官網(wǎng)上的正式公布的測試結(jié)果,并下載測試報告、程序、說明文檔以及軟硬件信息等。

LDBC SNB官方網(wǎng)站 http://ldbcouncil.org/benchmarks/snb

測試報告下載: http://ldbcouncil.org/sites/default/files/LDBC_SNB_I_20200726_SF30-100-300_tugraph.pdf

關(guān)于LDBC和LDBC-SNB測試:

1.關(guān)聯(lián)數(shù)據(jù)基準委員會(LDBC,Linked Data Benchmark Council)是由Oracle、Intel等軟硬件巨頭和主流圖數(shù)據(jù)庫廠商NeoTechnology和TigerGraph等組成的非贏利機構(gòu),是圖(Graph)和RDF數(shù)據(jù)管理的基準指南制定者與測試結(jié)果發(fā)布機構(gòu)。

2.社交網(wǎng)絡(luò)基準測試(SNB,Social Network Benchmark)是由關(guān)聯(lián)數(shù)據(jù)基準委員會(LDBC)開發(fā)的面向圖數(shù)據(jù)庫的基準測試(Benchmark)之一,分為交互式查詢(Interactive)和商業(yè)智能(BI)兩個場景。本次費馬公司測試了其中的交互式查詢場景,主要考察系統(tǒng)在并發(fā)情況下的更新和交互式查詢吞吐率。 與很多廠商采用的基于單項測試的評測方式相比,LDBC-SNB(Interactive)更接近真實場景并對數(shù)據(jù)庫系統(tǒng)的并發(fā)執(zhí)行性能和事務(wù)處理能力進行了更具挑戰(zhàn)性的評測。

測試詳情

據(jù)公司創(chuàng)始人洪春濤介紹,本次測試采用LDBC SNB的30G(SF30)、100G(SF100)、300G(SF300)三個規(guī)模的數(shù)據(jù)集,其中300G數(shù)據(jù)集包含8億結(jié)點53億邊及相關(guān)屬性。查詢操作由7類簡單只讀查詢,14類復(fù)雜只讀查詢和8類事務(wù)類更新查詢按LDBC SNB Interactive測試規(guī)范規(guī)定的比例組合并發(fā)執(zhí)行,并以吞吐率為性能指標??梢钥吹?,TuGraph在數(shù)據(jù)量增大時仍能保持較高的性能,體現(xiàn)了其對大規(guī)模數(shù)據(jù)的良好支撐能力。

下表為不同數(shù)據(jù)規(guī)模下的測試結(jié)果,吞吐率(OPS)表示每秒完成的操作次數(shù)。

表1. 不同數(shù)據(jù)規(guī)模SF30(30GB),SF100(100GB)和SF300(300GB)的測試結(jié)果

CTO朱曉偉表示,公司在測試環(huán)境準備、測試數(shù)據(jù)生成和導(dǎo)入、測試例程序的安裝和執(zhí)行、結(jié)果正確性的驗證方面都嚴格遵守LDBC-SNB的規(guī)范。整個測試過程由LDBC認證的評估師在其租用的標準云系統(tǒng)上操作完成,并對測試代碼進行了詳細的評審。整個測試環(huán)境和測試過程均完整披露并可在LDBC網(wǎng)站上公開下載,保證了測試結(jié)果的可信性和公正性。

LDBC-SNB Interactive的主要測試要求包括:基準程序會通過多個客戶端并發(fā)地發(fā)送各類讀寫請求到服務(wù)器端,每個請求都有相應(yīng)的計劃時間,數(shù)據(jù)庫需要盡可能地使得所有操作都按計劃正常進行;一旦某個操作晚于計劃時間超過1秒以上則視作超時,如果超時比例大于5%則無法通過測試,對圖數(shù)據(jù)庫的更新和查詢性能提出了很高的要求;查詢分為7類簡單查詢和14類復(fù)雜查詢,每類復(fù)雜查詢在不同數(shù)據(jù)規(guī)模下根據(jù)其復(fù)雜度以不同的頻率混合在一起,簡單查詢則穿插在這些復(fù)雜查詢之間;8類更新操作中不少都涉及多個數(shù)據(jù)對象的更新,因此需要ACID事務(wù)的支持來保證操作的正確性,SNB規(guī)范要求隔離級別至少達到提交讀(Read Committed),并在審計過程中對ACID支持進行了特別的測試。

值得注意的是,在本次測試中,TuGraph的超時比例為0%,且SNB實現(xiàn)了最高的隔離級別可串行化(Serializable),說明TuGraph在提供了高級別的事務(wù)隔離保證的同時仍然獲得了低延遲和遠遠超過其它數(shù)據(jù)庫的吞吐率。

CTO朱曉偉表示,相比同類型的圖數(shù)據(jù)庫產(chǎn)品,TuGraph可以支持更大的數(shù)據(jù)量,提供更快的響應(yīng),支持更多的并發(fā)查詢,因此也更適應(yīng)大數(shù)據(jù)時代。TuGraph在系統(tǒng)的設(shè)計目標上圍繞實時圖數(shù)據(jù)分析的特點展開:一方面,絕大部分請求是在最新數(shù)據(jù)上的只讀查詢,因此存儲引擎需要面向讀優(yōu)化,并需要對其中一些查詢操作采用并行的方式進行處理;另一方面,數(shù)據(jù)庫需要在快速完成這些只讀查詢的同時處理源源不斷的數(shù)據(jù)更新,而這些修改請求可能來自多個客戶端,因此需要完善的事務(wù)支持,并需要盡可能地避免使用全局鎖導(dǎo)致并發(fā)度的降低。為此,TuGraph實現(xiàn)了多版本的存儲使得只讀事務(wù)可以無阻塞地進行,并且提供了樂觀和悲觀兩種模式的讀寫事務(wù),從而針對不同情形提供最優(yōu)化的事務(wù)管理,在并發(fā)度和讀寫效率間取得較好的權(quán)衡;針對復(fù)雜的分析任務(wù),提供了并行遍歷和迭代式圖計算的接口,通過多個線程的協(xié)同工作來保障任務(wù)不會超時并持續(xù)占用系統(tǒng)資源。除此之外,TuGraph提供了豐富的開發(fā)接口:不僅支持描述式的查詢語言O(shè)penCypher以方便用戶更快地上手和開發(fā)原型,還提供了過程式的核心API讓用戶可以通過存儲過程的方式對一些需要追求極致性能的場景進行加速;存儲過程支持開發(fā)效率較高的Python和執(zhí)行效率較高的C++,未來還將增加受眾較廣的Java作為開發(fā)語言;訪問上同時支持RESTful和RPC兩種方式供用戶選擇。這些豐富的選項使得用戶可以在開發(fā)和生產(chǎn)環(huán)境上根據(jù)各自不同的場景和需求靈活地選擇最適合的使用方式,在易用性和高效性兩方面取得更好的平衡。

關(guān)于費馬

根據(jù)36氪此前報道,費馬科技成立于2016年5月,擁有圖數(shù)據(jù)平臺(TuGraph,曾用名LightGraph)、圖分析平臺(PandaGraph)兩大產(chǎn)品。TuGraph的定位是高性能單機版圖數(shù)據(jù)庫,這也是目前市場占有率最高的產(chǎn)品類型。費馬科技基于創(chuàng)始團隊在圖計算領(lǐng)域積累的經(jīng)驗以及領(lǐng)先的科研成果,研發(fā)出的TuGraph具有高性能、大數(shù)據(jù)量以及穩(wěn)定易用的特點,因此被廣大客戶所信賴。目前,費馬科技的產(chǎn)品已經(jīng)被多個領(lǐng)域的頭部客戶所采用,包括京東數(shù)科、大型國有銀行及商業(yè)銀行等金融業(yè)客戶,以及國家電網(wǎng)、中國商飛、西門子等工業(yè)部門用戶。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關(guān)文章