中國福建網(wǎng)

當(dāng)前位置:中國福建網(wǎng) > 國內(nèi) > 正文

騰訊進(jìn)一步擁抱開源:主導(dǎo)Apache社區(qū)新一代分布式存儲(chǔ)系統(tǒng)Ozone 1.0.0發(fā)布

作者: 編輯 來源:互聯(lián)網(wǎng) 發(fā)布時(shí)間:2020-09-25

┊文章閱讀:

剛剛獲悉,由騰訊云大數(shù)據(jù)團(tuán)隊(duì)主導(dǎo)的Ozone 1.0.0版本在Apache Hadoop社區(qū)正式發(fā)布。據(jù)了解,經(jīng)過2年多的社區(qū)持續(xù)開發(fā)和內(nèi)部1000+節(jié)點(diǎn)的實(shí)際落地驗(yàn)證,Ozone 1.0.0已經(jīng)具備了在大規(guī)模生產(chǎn)環(huán)境下實(shí)際部署的能力。

Ozone是Apache Hadoop社區(qū)推出的新一代分布式存儲(chǔ)系統(tǒng),它的出現(xiàn)滿足了大量小文件的存儲(chǔ)問題,解決了Hadoop分布式文件系統(tǒng)在可擴(kuò)展性上的缺陷。作為Hadoop生態(tài)圈的一款新的對象存儲(chǔ)系統(tǒng),能夠支持百億甚至千億級(jí)文件規(guī)模的存儲(chǔ)。

騰訊云大數(shù)據(jù)團(tuán)隊(duì)Ozone項(xiàng)目負(fù)責(zé)人陳怡表示,作為大數(shù)據(jù)領(lǐng)域的領(lǐng)導(dǎo)廠商,騰訊是國內(nèi)一線互聯(lián)網(wǎng)公司中最早加入社區(qū)的,目前已經(jīng)在Ozone項(xiàng)目上已經(jīng)主導(dǎo)完成了集群網(wǎng)絡(luò)拓?fù)涓兄拈_發(fā),以及數(shù)據(jù)寫入Multi-Raft Pipeline功能的開發(fā)。同時(shí),主導(dǎo)的StorageContainerManagerSCM高可用HA功能也正在開發(fā)中。

Ozone架構(gòu)圖

以集群網(wǎng)絡(luò)拓?fù)涓兄獊碚f,在傳統(tǒng)的大數(shù)據(jù)構(gòu)架下,有了網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),計(jì)算引擎的調(diào)度器可以將任務(wù)調(diào)度到離數(shù)據(jù)最近的節(jié)點(diǎn)來獲取“數(shù)據(jù)的局部性”。即便是新興的計(jì)算存儲(chǔ)分離構(gòu)架,同樣也需要集群網(wǎng)絡(luò)拓?fù)湫畔?來保證數(shù)據(jù)的故障容錯(cuò)能力和高可用性。

陳怡進(jìn)一步介紹說,在Ozone的Alpha發(fā)布后,騰訊內(nèi)部的大數(shù)據(jù)平臺(tái)上線了Ozone生產(chǎn)集群,承接了一部分業(yè)務(wù)的數(shù)據(jù)存儲(chǔ)。隨著數(shù)據(jù)服務(wù)體量的增加,逐漸發(fā)現(xiàn)Ozone寫入性能顯現(xiàn)出了一定的波動(dòng)和瓶頸?;谶@個(gè)發(fā)現(xiàn),騰訊Ozone項(xiàng)目組設(shè)計(jì)并開發(fā)了數(shù)據(jù)寫入Multi-Raft Pipeline功能,顯著的提升了Ozone的寫入吞吐量和性能。

此外,為了測試Ozone整體的穩(wěn)定性和性能,作為部署應(yīng)用的先鋒小隊(duì),騰訊內(nèi)部部署了一個(gè)1000個(gè)數(shù)據(jù)節(jié)點(diǎn)的集群。進(jìn)行了長達(dá)幾個(gè)月的穩(wěn)定性和壓力測試。期間團(tuán)隊(duì)遇到并解決了各種OOM、節(jié)點(diǎn)Crash、性能低于預(yù)期等問題。經(jīng)過全面的優(yōu)化之后,單集群1000個(gè)節(jié)點(diǎn)現(xiàn)已能長時(shí)間穩(wěn)定運(yùn)行,并且所有的數(shù)據(jù)都校驗(yàn)確認(rèn)正確無誤。

除了1000個(gè)節(jié)點(diǎn)集群的測試,1.0.0版本還進(jìn)行10億個(gè)元數(shù)據(jù)對象的測試和優(yōu)化,進(jìn)一步解決長期困擾HDFS的大量小文件問題。目前Ozone 1.0.0能夠輕松支持10億個(gè)10KB小對象的寫入,同時(shí)元數(shù)據(jù)節(jié)點(diǎn)內(nèi)存使用不超過64GB。

為了確保Ozone和Hive、Spark、Impala等計(jì)算框架的無縫對接,Ozone 1.0.0進(jìn)行了和Hive LLAP、Spark以及Impala的集成測試。TPC-DS的測試表明,在100GB和1TB兩種數(shù)據(jù)量大小下,Ozone總體比HDFS有3.5的優(yōu)勢。

經(jīng)過不斷的測試和優(yōu)化,升級(jí)后的Ozone 1.0.0在版本功能上有了質(zhì)的跨越。除了支持 Hadoop Compatible FileSystem、Hadoop 2.x以及 Hadoop3.x環(huán)境,Ozone 1.0.0還兼容Hadoop生態(tài)的Kerberos認(rèn)證體系,支持?jǐn)?shù)據(jù)的用戶無感知加密存放和Ranger授權(quán)集成、GDPR“Right to Erasure”以及網(wǎng)絡(luò)構(gòu)架感知。

未來,騰訊云大數(shù)據(jù)還將發(fā)揮自身技術(shù)優(yōu)勢和積累,在Ozone的基礎(chǔ)上開發(fā)基于SCM的新一代高性能分布式文件系統(tǒng),并持續(xù)推進(jìn)Ozone在更多騰訊內(nèi)外部業(yè)務(wù)的實(shí)踐落地,部署更大規(guī)模的生產(chǎn)集群。同時(shí),進(jìn)一步擁抱開源,深度參與Hadoop社區(qū),提高Ozone的可靠性、穩(wěn)定性和性能,將其打造成新一代大數(shù)據(jù)文件和對象混合存儲(chǔ)系統(tǒng)。

值得一提的是,騰訊大數(shù)據(jù)團(tuán)隊(duì)除了在Ozone項(xiàng)目上的貢獻(xiàn)之外,近年來在開源領(lǐng)域的貢獻(xiàn)正在逐步加速,目前已完成了大數(shù)據(jù)核心能力全開源。同時(shí),還結(jié)合實(shí)際業(yè)務(wù)場景推動(dòng)開源技術(shù)加速落地,通過技術(shù)實(shí)踐和創(chuàng)新持續(xù)回饋社區(qū)貢獻(xiàn)開源。在Apache基金會(huì)的大數(shù)據(jù)項(xiàng)目上,騰訊已經(jīng)為主流的Hadoop、Spark、Flink等項(xiàng)目貢獻(xiàn)了大量的特性和patch。

  • 分類目錄
  • 軟文發(fā)布平臺(tái)
  • 勞務(wù)外包公司
  • 帆布水池
  • 運(yùn)維開發(fā)網(wǎng)
  • 小程序開發(fā)
  • 淘寶優(yōu)惠券
  • IT新聞
  • 淘寶erp
  • 植物提取物網(wǎng)
  • 站長網(wǎng)
  • 源碼論壇
  • 激光打標(biāo)機(jī)
  • 丹泊儀器
  • 礦山生態(tài)修復(fù)
  • 青島月子會(huì)所
  • 知識(shí)付費(fèi)
  • 辦公家具
  • 呱呱贊小程序
  • 淄博java培訓(xùn)
  • 小程序開發(fā)
  • seo外包公司
  • 盈江新財(cái)網(wǎng)
  • 工程拍照軟件
  • 速賣通論壇
  • 極客網(wǎng)
  • 甘州文化網(wǎng)
  • 優(yōu)鞋論壇
  • 寧波小程序開發(fā)
  • 域名論壇
  • 微軟crm
  • andon系統(tǒng)
  • 鄭州網(wǎng)站建設(shè)
  • seo學(xué)習(xí)網(wǎng)
  • 奢侈品回收
  • 一對一輔導(dǎo)
  • 黑客視野新聞