當(dāng)前位置:首頁 >  科技 >  IT業(yè)界 >  正文

Hadoop大數(shù)據(jù)“存算分離”,柏科數(shù)據(jù) ISCloud分布式存儲"提質(zhì)增效"

 2021-08-24 17:09  來源: 互聯(lián)網(wǎng)   我來投稿 撤稿糾錯

  阿里云優(yōu)惠券 先領(lǐng)券再下單

數(shù)據(jù)湖的發(fā)展契機(jī),來源于近年來的AI熱潮和云計算、5G的發(fā)展,在日益發(fā)展的海量數(shù)據(jù)時代,數(shù)據(jù)已成為企業(yè)發(fā)展的核心資產(chǎn),通過構(gòu)建適用于大數(shù)據(jù)的底層架構(gòu),圍繞Hadoop提供語義一致性、數(shù)據(jù)治理和安全性。

Hadoop作為數(shù)據(jù)湖最常用的解決方案之一,其的部署和需求仍然很大并且正在增長。在最近的一項涉及235名受訪者的調(diào)查中,34%的受訪者目前正在使用Hadoop進(jìn)行數(shù)據(jù)和分析工作,另有55%的受訪者計劃在未來24個月內(nèi)采取同樣方案,總計需求量達(dá)到89%(Gartner,2016)。

在Hadoop大數(shù)據(jù)平臺方案中,當(dāng)存儲空間或計算資源不足時,只能同時對兩者進(jìn)行擴(kuò)容,將導(dǎo)致額外成本的增加。假設(shè)用戶對存儲資源的需求遠(yuǎn)大于對計算資源的需求,那么同時擴(kuò)容計算和存儲后,新擴(kuò)容的計算資源就被浪費了,反之,存儲資源被浪費。獨立擴(kuò)展計算或存儲的架構(gòu)設(shè)計,被認(rèn)為是更加靈活的擴(kuò)容方式。

因此,業(yè)內(nèi)新擴(kuò)容方式“存算分離”架構(gòu)的優(yōu)勢逐漸明顯,“存算分離”成了大數(shù)據(jù)架構(gòu)發(fā)展的必然趨勢,成了解決行業(yè)用戶在使用Hadoop時,面臨計算資源浪費、存儲性能低、管理成本過高等痛點的利器。最初在Hadoop1.0時代,計算和存儲是高度融合的,僅能處理單一的MapReduce分析業(yè)務(wù);如今已經(jīng)到了Hadoop3.0時代,計算存儲走向分離,通過Hadoop架構(gòu)策略,優(yōu)化了冷熱數(shù)據(jù)的存儲。打造了更適合企業(yè)級市場,資源云化和靈活擴(kuò)展,能夠讓用戶享受更專業(yè)的存儲,更佳的可靠性和利用率。

ISCloud分布式存儲系統(tǒng)面向海量數(shù)據(jù)場景,針對大數(shù)據(jù)Apache Hadoop等應(yīng)用場景,提供原生接口,將原生Hadoop集群從當(dāng)前計算、存儲一體化狀態(tài),拆分成計算和存儲兩個獨立集群,實現(xiàn)“存算分離”形式,充分吸納計算、存儲兩個產(chǎn)業(yè)的最終成果,加速釋放數(shù)據(jù)價值。

• 提供標(biāo)準(zhǔn)接口,實現(xiàn)智能化負(fù)載均衡

非結(jié)構(gòu)化的原始數(shù)據(jù)可以通過Sqoop、DistCp等工具直接存儲在ISCloud分布式存儲上,業(yè)務(wù)數(shù)據(jù)庫結(jié)構(gòu)化數(shù)據(jù)和應(yīng)用數(shù)據(jù)可以通過Spark、Kafka等HBase分布式數(shù)據(jù)倉及Hadoop大數(shù)據(jù)Hive倉庫內(nèi)。HBase表數(shù)據(jù)和Hive內(nèi)部表數(shù)據(jù)仍然通過HDFS來存儲。ISCloud分布式存儲在存儲海量非結(jié)構(gòu)化數(shù)據(jù),甚至是海量小文件的同時,減輕HBase及Hive的壓力,為后續(xù)擴(kuò)容單一屬性集群提供基礎(chǔ)。

? 協(xié)議互通特性,提高數(shù)據(jù)分析效率

ISCloud分布式存儲采用多種協(xié)議互通技術(shù),部署語義抽象層,面對多樣化結(jié)構(gòu)數(shù)據(jù)提供適合文件、對象、塊及大數(shù)據(jù)的原生語義,為Apache Hadoop計算層提供了標(biāo)準(zhǔn)的Hadoop文件系統(tǒng)API,支持文件、大數(shù)據(jù)接口訪問,免數(shù)據(jù)遷移,縮短分析路徑。實現(xiàn)多集群數(shù)據(jù)融合互通,提升數(shù)據(jù)共享和分析效率。

• 降本增效,大幅降低TCO

隨著大數(shù)據(jù)應(yīng)用的全面普及,存算分離已成為企業(yè)大數(shù)據(jù)平臺建設(shè)的首選。采用全對稱分布式NameNode,集群性能和支持文件數(shù)隨節(jié)點數(shù)目增加,單一命名空間支持文件數(shù)達(dá)百億級。計算存儲分離,按需擴(kuò)展,實現(xiàn)精準(zhǔn)投資。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)標(biāo)簽
數(shù)據(jù)存儲

相關(guān)文章

  • 分布式存儲費用高嗎?大概需要多少錢

    分布式存儲的費用是否高,取決于多個因素,包括存儲容量、性能要求、服務(wù)提供商、計費模式等。因此,無法簡單地給出一個“高”或“不高”的答案。通常分布式存儲費用通常包含存儲費用、網(wǎng)絡(luò)費用、增值服務(wù)費、數(shù)據(jù)遷移、API調(diào)用、管理維護(hù)等費用。

  • 當(dāng)直播“頂流”遇上存儲“頂流”,羅永浩和Lexar雷克沙的初次會面

    又是一年雙十一熱銷大促,今年各大平臺的直播間可謂是熱鬧非凡,我們熟悉的羅永浩“交個朋友”直播間也如約帶來了很多優(yōu)惠好貨。11月1日,羅永浩“交個朋友”直播間攜手眾多品牌再度歸來,帶貨實力依然抗打。作為數(shù)碼3C類目的帶貨“扛把子”,我們發(fā)現(xiàn)此次羅永浩直播間中除了有大家熟知的各大科技數(shù)碼品牌外,還有一些

    標(biāo)簽:
    數(shù)據(jù)存儲
  • 青云QingCloud 非結(jié)構(gòu)化數(shù)據(jù)存儲 U10000 在海量小文件場景的應(yīng)用

    青云科技(qingcloud.com)QingStorU10000作為一款分布式存儲,在支持線性擴(kuò)展上表現(xiàn)不俗。U10000最低3節(jié)點起步,隨著節(jié)點數(shù)量的增長,存儲容量和存儲集群的性能都會線性增長。U10000的存儲效率比較高。通過可靈活配置的EC糾刪碼,能讓整個集群的物理磁盤可用空間達(dá)到90%以上

    標(biāo)簽:
    數(shù)據(jù)存儲
  • 青云QingCloud “很能存”的非結(jié)構(gòu)化存儲 U10000

    IDC此前的數(shù)據(jù)顯示,2018年,全球數(shù)據(jù)量為33ZB,而在2025年,全球數(shù)據(jù)量將達(dá)到175ZB,這其中有80%都是非結(jié)構(gòu)化數(shù)據(jù)。宏觀的數(shù)據(jù)趨勢令人驚嘆,存儲廠商的反應(yīng)更真實。這從青云科技(qingcloud.com)存儲QingStor的產(chǎn)品線調(diào)整,也可見一斑。青云在成立之初主要提供公有云服務(wù),

    標(biāo)簽:
    數(shù)據(jù)存儲
  • 上海攝影展新品發(fā)布,lexar雷克沙開創(chuàng)高端存儲新篇章

    8月10日,第24屆上海國際攝影器材和數(shù)碼影像展覽會(以下簡稱P&IShanghai)在上海新國際博覽中心隆重開幕。在此次展會上,Lexar雷克沙不僅帶來了全新升級的影像存儲產(chǎn)品系列,還啟動了記憶之城·2023影像創(chuàng)作大賽,并在現(xiàn)場舉辦了《上海記憶》視覺文獻(xiàn)展和多場攝影講座。旗艦品質(zhì)引領(lǐng)創(chuàng)新P&IS

    標(biāo)簽:
    數(shù)據(jù)存儲

熱門排行

信息推薦