首頁猿問 hadoop有哪些優(yōu)缺點

hadoop有哪些優(yōu)缺點

Hadoop

FFIVE 2019-02-22 19:14:39

hadoop有哪些優(yōu)缺點

查看完整描述

2 回答

莫回?zé)o

TA貢獻1865條經(jīng)驗獲得超7個贊

Hadoop的優(yōu)缺點介紹：
（一）優(yōu)點：
（一）高可靠性。Hadoop按位存儲和處理數(shù)據(jù)的能力值得人們信賴;
（二）高擴展性。Hadoop是在可用的計算機集簇間分配數(shù)據(jù)并完成計算任務(wù)的，這些集簇可以方便地擴展到數(shù)以千計的節(jié)點中。
（三）高效性。Hadoop能夠在節(jié)點之間動態(tài)地移動數(shù)據(jù)，并保證各個節(jié)點的動態(tài)平衡，因此處理速度非常快。
（四）高容錯性。Hadoop能夠自動保存數(shù)據(jù)的多個副本，并且能夠自動將失敗的任務(wù)重新分配。
（二）缺點：
（一）不適合低延遲數(shù)據(jù)訪問。
（二）無法高效存儲大量小文件。
（三）不支持多用戶寫入及任意修改文件。

反對回復(fù) 2019-03-02

當(dāng)年話下

TA貢獻1890條經(jīng)驗獲得超9個贊

一、HDFS缺點：

1、不能做到低延遲：由于hadoop針對高數(shù)據(jù)吞吐量做了優(yōu)化，犧牲了獲取數(shù)據(jù)的延遲，所以對于低延遲數(shù)據(jù)訪問，不適合hadoop，對于低延遲的訪問需求，HBase是更好的選擇，

2、不適合大量的小文件存儲：由于namenode將文件系統(tǒng)的元數(shù)據(jù)存儲在內(nèi)存中，因此該文件系統(tǒng)所能存儲的文件總數(shù)受限于namenode的內(nèi)存容量，根據(jù)經(jīng)驗，每個文件、目錄和數(shù)據(jù)塊的存儲信息大約占150字節(jié)。

3、不適合多用戶寫入文件，修改文件：Hadoop2.0雖然支持文件的追加功能，但是還是不建議對HDFS上的文件進行修改，因為效率低。

4、對于上傳到HDFS上的文件，不支持修改文件，HDFS適合一次寫入，多次讀取的場景。

5、HDFS不支持多用戶同時執(zhí)行寫操作，即同一時間，只能有一個用戶執(zhí)行寫操作。

二、HDFS優(yōu)點：

1、高可靠性。Hadoop按位存儲和處理數(shù)據(jù)的能力值得人們信賴。

2、高擴展性。Hadoop是在可用的計算機集簇間分配數(shù)據(jù)并完成計算任務(wù)的，這些集簇可以方便地擴展到數(shù)以千計的節(jié)點中。

3、高效性。Hadoop能夠在節(jié)點之間動態(tài)地移動數(shù)據(jù)，并保證各個節(jié)點的動態(tài)平衡，因此處理速度非?？?。

4、高容錯性。Hadoop能夠自動保存數(shù)據(jù)的多個副本，并且能夠自動將失敗的任務(wù)重新分配。

5、低成本。與一體機、商用數(shù)據(jù)倉庫以及QlikView、Yonghong Z-Suite等數(shù)據(jù)集市相比，hadoop是開源的，項目的軟件成本因此會大大降低。

6、Hadoop帶有用Java語言編寫的框架，因此運行在 Linux 生產(chǎn)平臺上是非常理想的。Hadoop 上的應(yīng)用程序也可以使用其他語言編寫，比如 C++。

一、 Hadoop 特點

1、支持超大文件：一般來說，HDFS存儲的文件可以支持TB和PB級別的數(shù)據(jù)。

2、檢測和快速應(yīng)對硬件故障：在集群環(huán)境中，硬件故障是常見性問題。因為有上千臺服務(wù)器連在一起，故障率高，因此故障檢測和自動恢復(fù)hdfs文件系統(tǒng)的一個設(shè)計目標(biāo)。

3、流式數(shù)據(jù)訪問：HDFS的數(shù)據(jù)處理規(guī)模比較大，應(yīng)用一次需要大量的數(shù)據(jù)，同時這些應(yīng)用一般都是批量處理，而不是用戶交互式處理，應(yīng)用程序能以流的形式訪問數(shù)據(jù)庫。

4、簡化的一致性模型：對于外部使用用戶，不需要了解hadoop底層細節(jié)，比如文件的切塊，文件的存儲，節(jié)點的管理。

5、高容錯性：數(shù)據(jù)自動保存多個副本，副本丟失后自動恢復(fù)。可構(gòu)建在廉價機上，實現(xiàn)線性（橫向）擴展，當(dāng)集群增加新節(jié)點之后，namenode也可以感知，將數(shù)據(jù)分發(fā)和備份到相應(yīng)的節(jié)點上。

6、商用硬件：Hadoop并不需要運行在昂貴且高可靠的硬件上，它是設(shè)計運行在商用硬件的集群上的，因此至少對于龐大的集群來說，節(jié)點故障的幾率還是非常高的。HDFS遇到上述故障時，被設(shè)計成能夠繼續(xù)運行且不讓用戶察覺到明顯的中斷。

反對回復(fù) 2019-03-02

2 回答
0 關(guān)注
989 瀏覽

關(guān)注

添加回答

舉報

0/150

提交

取消

使用 Ctrl+D 可將網(wǎng)站添加到書簽

微信客服

購課補貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動學(xué)習(xí)伙伴

公眾號

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號

第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

熱搜

最近搜索清空

hadoop有哪些優(yōu)缺點

hadoop有哪些優(yōu)缺點

2 回答

添加回答