請(qǐng)教一下Hadoop的本質(zhì)是否理解正確?
我想請(qǐng)教一下,通俗來講,可否這么理解Hadoop?
相當(dāng)于跑在linux上的,一個(gè)可以一臺(tái)也可以多臺(tái)集群的虛擬“操作系統(tǒng)”(就像裝虛擬機(jī)玩一樣),但這個(gè)“系統(tǒng)”(HDFS),可以幫我們把所有其他物理節(jié)點(diǎn)的硬盤、CPU資源,全部集中調(diào)度了。我們只需要把所有的集群電腦看成一臺(tái)大的、性能超強(qiáng)的“電腦”或大型存儲(chǔ)就行。
然后內(nèi)部的處理,類似一個(gè)巨大的MongoDB,我們把數(shù)據(jù)按照 KEY/VALUE 的結(jié)構(gòu),往這個(gè)大型的“系統(tǒng)”里面扔,還可以寫一些程序,按照我們自己的邏輯,從數(shù)據(jù)庫里面取得數(shù)據(jù),算出結(jié)果。只不過傳統(tǒng)的SQL,MongoDB是跑在一臺(tái)機(jī)器上的,而Hadoop是可以分布的,不需要我們管它怎么去分布,我們向它發(fā)統(tǒng)一的命令,它給我們結(jié)果。
不一定準(zhǔn)確,但不知道這樣的通俗理解,是否正確?謝謝指教!