講師回答 / 叁金
首先,java操作hdfs相關(guān)的代碼網(wǎng)上一搜一大把。然后,python是一門很好的語言,也是我喜歡的語言。所以選擇通過python做示例演示。最近發(fā)現(xiàn)hdfs3不支持hadoop的acl權(quán)限模型,不知道有沒有入了坑的同學。。。正在糾結(jié)中!? ? ? 還是對java支持比較好。
2018-03-15
講師回答 / 叁金
服務(wù)器分布在不同的機架(雙電源),為了防止某條線路斷電導致服務(wù)器失效(也解決了部分網(wǎng)絡(luò)機架網(wǎng)絡(luò)出問題的情況)備份的過程(默認3份) 首先,如果client是集群內(nèi)的節(jié)點則將第一份存儲在client上否則隨機存儲到其他節(jié)點,第二份節(jié)點存儲到其他機架節(jié)點,第三份存儲到本機架節(jié)點。(注此處需開啟hadoop的機架感知屬性,默認是關(guān)閉的,如果未開啟機架感知 則認為 隨機放到了三個節(jié)點上,防止某些節(jié)點出問題造成數(shù)據(jù)丟失)通過zookeeper實現(xiàn)的namenode主備切換,防止因為namenode失效造成的數(shù)據(jù)無法...
2018-02-04
講師回答 / 叁金
?在向HDFS的寫操作中,不得不提一下“數(shù)據(jù)流管道”。數(shù)據(jù)流管道在Google實現(xiàn)他們的分布式文件系統(tǒng)(GFS)時就已引入,其目的是:在寫一份數(shù)據(jù)的多個副本時,可以充分利用集群中每一臺機器的帶寬,避免網(wǎng)絡(luò)瓶頸和高延時的連接,最小化推送所有數(shù)據(jù)的延時。? 其實這里我可能表述的不太準確,Client在保存數(shù)據(jù)的過程當中,將數(shù)據(jù)發(fā)送到第一個數(shù)據(jù)節(jié)點DateNode 1,然后在第一個DateNode節(jié)點在本地保存數(shù)據(jù)的同時,將數(shù)據(jù)推送到第二個數(shù)據(jù)節(jié)點DateNode 2,同理在第二個節(jié)點本地保存數(shù)據(jù)的同時,也會由...
2018-01-23
講師回答 / 叁金
首先,建議使用anaconda的python科學計算集成環(huán)境,利用conda去管理python相關(guān)的模塊,如果你用的是anaconda你可以嘗試以下命令:<...code...>? ?
2018-01-18
講師回答 / 叁金
首先,建議使用anaconda的python科學計算集成環(huán)境,利用conda去管理python相關(guān)的模塊,其也會管理用到的c++模塊,如果你用的是anaconda你可以嘗試以下命令:<...code...>如果你不是anaconda環(huán)境,ubuntu系統(tǒng)可以嘗試:<...code...>其他的可以直接搜索github libhdfs3 進行編譯安裝。python訪問hdfs除了hdfs3還有其他模塊可以使用比如snakebite等,大家也可以看看其使用方式
2018-01-09
講師回答 / 叁金
with 語句適用于對資源進行訪問的場合,確保不管使用過程中是否發(fā)生異常都會執(zhí)行必要的“清理”操作,釋放資源,比如文件使用后自動關(guān)閉、線程中鎖的自動獲取和釋放等。類似于 java 語言中的:<...code...>或者是C#中的:<...code...>作用就是自動釋放資源,要想理解可以自己了解下python的上下文管理器概念。
2018-01-02
講師回答 / 叁金
這個。。。? ?盡自己所能吧。。。? ? 盡量把話題往自己熟悉的領(lǐng)域帶。? ? 肚子里還是要有點干貨啊,要不面試不發(fā)虛嗎。 肚子里面有干貨了 還怕不知道咋回答他嗎。? 面試官也是技術(shù)人員,一般都比較好說話!
2017-12-22