1 回答

嗶嗶one
TA貢獻1854條經(jīng)驗 獲得超8個贊
一、這種方式有很多的優(yōu)點:1. 如果我們一次性入庫hbase巨量數(shù)據(jù),處理速度慢不說,還特別占用Region資源, 一個比較高效便捷的方法就是使用 “Bulk Loading”方法,即HBase提供的HFileOutputFormat類。
2. 它是利用hbase的數(shù)據(jù)信息按照特定格式存儲在hdfs內(nèi)這一原理,直接生成這種hdfs內(nèi)存儲的數(shù)據(jù)格式文件,然后上傳至合適位置,即完成巨量數(shù)據(jù)快速入庫的辦法。配合mapreduce完成,高效便捷,而且不占用region資源,增添負載。
二、這種方式也有很大的限制:
1. 僅適合初次數(shù)據(jù)導入,即表內(nèi)數(shù)據(jù)為空,或者每次入庫表內(nèi)都無數(shù)據(jù)的情況。
2. HBase集群與Hadoop集群為同一集群,即HBase所基于的HDFS為生成HFile的MR的集群.
- 1 回答
- 0 關注
- 3508 瀏覽
添加回答
舉報
0/150
提交
取消