講師回答 / 徐老師
這里沒法上傳文件,我把數(shù)據(jù)格式給你發(fā)一部分,你可以參考這個格式{"id":"158008900435","uid":"120010010445","nickname":"jack435","gold":445,"watchnumpv":4350,"watchnumuv":870,"hots":1305,"nofollower":435,"looktime":8700,"smlook":2175,"follower":1740,"gifter":870,"length":2610,"area":"A_US"...
2020-01-25
講師回答 / 徐老師
在你的另一個提問里面已經(jīng)回復(fù)了數(shù)據(jù)格式,因?yàn)檫@里無法上傳文件,只能發(fā)了一部分?jǐn)?shù)據(jù)實(shí)例,不好意思
已采納回答 / 小小新_Not_Found
視頻中的json數(shù)據(jù)video_rating.log是講師自己做的假數(shù)據(jù),目前也并沒有放入到下載資料中,你可以按照上一個視頻中的字段自己仿照做一個假數(shù)據(jù)<...圖片...>
2019-12-26
已采納回答 / 徐老師
提前進(jìn)行map的局部聚合,會提高性能,因?yàn)榫酆虾髆ap端通過shuffle發(fā)送到reduce端的數(shù)據(jù)就少了,對應(yīng)的就減少了網(wǎng)絡(luò)傳輸?shù)臅r間
2019-12-26
已采納回答 / 徐老師
HDFS中的主節(jié)點(diǎn)磁盤不需要特別大,但是內(nèi)存要大一些,因?yàn)镠DFS的主節(jié)點(diǎn)中會啟動namenode進(jìn)程
2019-12-25
講師回答 / 徐老師
執(zhí)行ssh-keygen是為了做免密碼登錄的,因?yàn)閔adoop在啟動的時候默認(rèn)會使用ssh 命令免密碼登錄到對應(yīng)的機(jī)器啟動集群的相關(guān)服務(wù),不管是單機(jī)還是集群都是這個流程
2019-12-21