-
數(shù)據(jù)存儲(chǔ)的設(shè)計(jì)
查看全部 -
存儲(chǔ)設(shè)計(jì)hbase
查看全部 -
hbase 表存儲(chǔ)的結(jié)構(gòu)
查看全部 -
存儲(chǔ)模式
1、列存儲(chǔ)模式:可壓縮數(shù)據(jù),數(shù)據(jù)維護(hù)成本低,適合分析型數(shù)據(jù)
2、行存儲(chǔ)模式:數(shù)據(jù)維護(hù)成本高,適合事物型數(shù)據(jù)
行式存儲(chǔ)壓縮比列式效率低
查看全部 -
實(shí)現(xiàn)接口:
查看全部 -
ZooKeeper
1、HDFS
2、Master/backup Master
3、Client
查看全部 -
HBase的存儲(chǔ)模式
1、行式存儲(chǔ):索引性能好
2、列式存儲(chǔ):壓縮性能好
3、行式存儲(chǔ)與列式存儲(chǔ)的應(yīng)用環(huán)境:
1)單列或多列或使用頻率較高,事務(wù)或讀取頻率不高、數(shù)據(jù)量非常大,使用列式存儲(chǔ)
2)行式存儲(chǔ)實(shí)現(xiàn)解決關(guān)系型數(shù)據(jù)解決方案,表與表之間有很強(qiáng)的關(guān)聯(lián)關(guān)系且數(shù)據(jù)量不大的話,使用行式存儲(chǔ)。
查看全部 -
HBase的存儲(chǔ)模式
1、行式存儲(chǔ):索引性能好
2、列式存儲(chǔ):壓縮性能好
查看全部 -
行式存儲(chǔ)與列式存儲(chǔ):
行式存儲(chǔ)是經(jīng)典的 RDBMS 的存儲(chǔ)解決方案,有以下特性:
- 在底層的存儲(chǔ)結(jié)構(gòu)上,每行的數(shù)據(jù)都存儲(chǔ)在一起
- 行式存儲(chǔ)維護(hù)大量的索引,存儲(chǔ)成本較高,但是對(duì)于隨機(jī)讀的效率非常高
- 強(qiáng)事務(wù)支持
- 適用場(chǎng)景:OLTP 應(yīng)用
列式存儲(chǔ)是 HBase 等 NoSQL 列式數(shù)據(jù)庫(kù)的解決方案,有以下特性:
- 在底層的存儲(chǔ)結(jié)構(gòu)上,每列的數(shù)據(jù)都存儲(chǔ)在一起
- 列式存儲(chǔ)由于其稀疏性的特性,存儲(chǔ)成本較低。
- 適用場(chǎng)景:OLAP 應(yīng)用,事務(wù)要求不高且數(shù)據(jù)量大查看全部 -
????? 列族其實(shí)就是多個(gè)列的組合,Hbase表中的每個(gè)列都是歸屬于某個(gè)列族,列族是表的Schema的一部分,但是列不是,所以我們創(chuàng)建表的時(shí)候需要指定列族而不需要指定列的名稱,列名都是以列族名作為前綴的,訪問(wèn)控制和內(nèi)存的使用統(tǒng)計(jì)都是基于列族進(jìn)行的,這樣設(shè)計(jì)的前提是,某個(gè)列族中的所有列是經(jīng)常需要一起訪問(wèn)的,這樣才會(huì)使得數(shù)據(jù)存取的效率是最優(yōu)的。
???? 通常他們會(huì)有相同的數(shù)據(jù)類型,這樣當(dāng)我們對(duì)同一個(gè)列族中的數(shù)據(jù)進(jìn)行壓縮的時(shí)候可以獲取更好的壓縮性能。所以所Hbase本質(zhì)上是一個(gè)列族式存儲(chǔ)。
? ?
查看全部 -
region特點(diǎn):
負(fù)載均衡和分布式存儲(chǔ)的最小單元(存儲(chǔ)的最小單元hfile)
數(shù)量太多會(huì)導(dǎo)致運(yùn)行下降,太少會(huì)降低可擴(kuò)展性,降低并行能力(region的數(shù)量不能低于節(jié)點(diǎn)的數(shù)量)
拆分策略 下線-拆分-子信息加入meta元信息-region server-同步到master
查看全部 -
HBase Table的組成:
table = Rowkey + Family + Column + Timtstamp + Value
數(shù)據(jù)存儲(chǔ)模式:
(Table,RowKey,Family,Column,Timestamp )->value
查看全部 -
壓縮方式對(duì)比
查看全部 -
測(cè)試查看全部
-
壓縮屬性詳解
查看全部
舉報(bào)