課程
/云計(jì)算&大數(shù)據(jù)
/大數(shù)據(jù)
/Hadoop基礎(chǔ)及演練
個(gè)人覺得后者對(duì)降低寫的latency更友好吧
2018-01-23
源自:Hadoop基礎(chǔ)及演練 2-2
正在回答
?在向HDFS的寫操作中,不得不提一下“數(shù)據(jù)流管道”。數(shù)據(jù)流管道在Google實(shí)現(xiàn)他們的分布式文件系統(tǒng)(GFS)時(shí)就已引入,其目的是:在寫一份數(shù)據(jù)的多個(gè)副本時(shí),可以充分利用集群中每一臺(tái)機(jī)器的帶寬,避免網(wǎng)絡(luò)瓶頸和高延時(shí)的連接,最小化推送所有數(shù)據(jù)的延時(shí)。? 其實(shí)這里我可能表述的不太準(zhǔn)確,Client在保存數(shù)據(jù)的過程當(dāng)中,將數(shù)據(jù)發(fā)送到第一個(gè)數(shù)據(jù)節(jié)點(diǎn)DateNode 1,然后在第一個(gè)DateNode節(jié)點(diǎn)在本地保存數(shù)據(jù)的同時(shí),將數(shù)據(jù)推送到第二個(gè)數(shù)據(jù)節(jié)點(diǎn)DateNode 2,同理在第二個(gè)節(jié)點(diǎn)本地保存數(shù)據(jù)的同時(shí),也會(huì)由第二個(gè)數(shù)據(jù)節(jié)點(diǎn)將數(shù)據(jù)同送給第三個(gè)數(shù)據(jù)節(jié)點(diǎn)DateNode 3。??這樣啊,每個(gè)節(jié)點(diǎn)都能承擔(dān)寫數(shù)據(jù)時(shí)的部分網(wǎng)絡(luò)流量,降低了客戶端發(fā)送多分?jǐn)?shù)據(jù)時(shí)對(duì)網(wǎng)絡(luò)的沖擊
慕UI6419280
叁金 回復(fù) 慕UI6419280
慕仰2907144 回復(fù) 叁金
寫的話也是按照最近的dataNODE來進(jìn)行存儲(chǔ)吧
客戶端要向HDFS寫數(shù)據(jù),首先要跟namenode通信以確認(rèn)可以寫文件并獲得接收文件block的datanode,然后,客戶端按順序?qū)⑽募饌€(gè)block傳遞給相應(yīng)datanode,并由接收到block的datanode負(fù)責(zé)向其他datanode復(fù)制block的副本,百度到的,老師的DataNode-2和DataNode-3應(yīng)該是DataNode-1的副本
舉報(bào)
與大數(shù)據(jù)密不可分的Hadoop框架,你值得學(xué)習(xí)
1 回答關(guān)于HDFS的寫流程
1 回答如果寫流程出錯(cuò)了,怎么處理
3 回答讀流程的疑問
1 回答為何hdfs不適合文件并發(fā)寫入?
2 回答關(guān)于視頻中讀流程所舉的例子有些疑問
Copyright ? 2025 imooc.com All Rights Reserved | 京ICP備12003892號(hào)-11 京公網(wǎng)安備11010802030151號(hào)
購課補(bǔ)貼聯(lián)系客服咨詢優(yōu)惠詳情
慕課網(wǎng)APP您的移動(dòng)學(xué)習(xí)伙伴
掃描二維碼關(guān)注慕課網(wǎng)微信公眾號(hào)
2018-01-27
?在向HDFS的寫操作中,不得不提一下“數(shù)據(jù)流管道”。數(shù)據(jù)流管道在Google實(shí)現(xiàn)他們的分布式文件系統(tǒng)(GFS)時(shí)就已引入,其目的是:在寫一份數(shù)據(jù)的多個(gè)副本時(shí),可以充分利用集群中每一臺(tái)機(jī)器的帶寬,避免網(wǎng)絡(luò)瓶頸和高延時(shí)的連接,最小化推送所有數(shù)據(jù)的延時(shí)。? 其實(shí)這里我可能表述的不太準(zhǔn)確,Client在保存數(shù)據(jù)的過程當(dāng)中,將數(shù)據(jù)發(fā)送到第一個(gè)數(shù)據(jù)節(jié)點(diǎn)DateNode 1,然后在第一個(gè)DateNode節(jié)點(diǎn)在本地保存數(shù)據(jù)的同時(shí),將數(shù)據(jù)推送到第二個(gè)數(shù)據(jù)節(jié)點(diǎn)DateNode 2,同理在第二個(gè)節(jié)點(diǎn)本地保存數(shù)據(jù)的同時(shí),也會(huì)由第二個(gè)數(shù)據(jù)節(jié)點(diǎn)將數(shù)據(jù)同送給第三個(gè)數(shù)據(jù)節(jié)點(diǎn)DateNode 3。??這樣啊,每個(gè)節(jié)點(diǎn)都能承擔(dān)寫數(shù)據(jù)時(shí)的部分網(wǎng)絡(luò)流量,降低了客戶端發(fā)送多分?jǐn)?shù)據(jù)時(shí)對(duì)網(wǎng)絡(luò)的沖擊
2018-02-04
寫的話也是按照最近的dataNODE來進(jìn)行存儲(chǔ)吧
2018-01-26
客戶端要向HDFS寫數(shù)據(jù),首先要跟namenode通信以確認(rèn)可以寫文件并獲得接收文件block的datanode,然后,客戶端按順序?qū)⑽募饌€(gè)block傳遞給相應(yīng)datanode,并由接收到block的datanode負(fù)責(zé)向其他datanode復(fù)制block的副本,百度到的,老師的DataNode-2和DataNode-3應(yīng)該是DataNode-1的副本