首頁猿問 hbase和hive的差別是什么，...

hbase和hive的差別是什么，各自適用在什么場景中

Hbase

慕萊塢森 2018-10-02 13:13:35

查看完整描述

1 回答

慕婉清6462132

TA貢獻1804條經(jīng)驗獲得超2個贊

1. Hive中的表是純邏輯表，就只是表的定義等，即表的元數(shù)據(jù)。Hive本身不存儲數(shù)據(jù)，它完全依賴HDFS和MapReduce。這樣就可以將結(jié)構(gòu)化的數(shù)據(jù)文件映射為為一張數(shù)據(jù)庫表，并提供完整的SQL查詢功能，并將SQL語句最終轉(zhuǎn)換為MapReduce任務(wù)進行運行。而HBase表是物理表，適合存放非結(jié)構(gòu)化的數(shù)據(jù)。
2. Hive是基于MapReduce來處理數(shù)據(jù),而MapReduce處理數(shù)據(jù)是基于行的模式；HBase處理數(shù)據(jù)是基于列的而不是基于行的模式，適合海量數(shù)據(jù)的隨機訪問。
3. HBase的表是疏松的存儲的，因此用戶可以給行定義各種不同的列；而Hive表是稠密型，即定義多少列，每一行有存儲固定列數(shù)的數(shù)據(jù)。
4. Hive使用Hadoop來分析處理數(shù)據(jù)，而Hadoop系統(tǒng)是批處理系統(tǒng)，因此不能保證處理的低遲延問題；而HBase是近實時系統(tǒng)，支持實時查詢。
5. Hive不提供row-level的更新，它適用于大量append-only數(shù)據(jù)集（如日志）的批任務(wù)處理。而基于HBase的查詢，支持和row-level的更新。
6. Hive提供完整的SQL實現(xiàn)，通常被用來做一些基于歷史數(shù)據(jù)的挖掘、分析。而HBase不適用與有join，多級索引，表關(guān)系復雜的應(yīng)用場景。

反對回復 2018-10-24