講師回答 / 徐老師
這里沒法上傳文件,我把數(shù)據(jù)格式給你發(fā)一部分,你可以參考這個格式{"id":"158008900435","uid":"120010010445","nickname":"jack435","gold":445,"watchnumpv":4350,"watchnumuv":870,"hots":1305,"nofollower":435,"looktime":8700,"smlook":2175,"follower":1740,"gifter":870,"length":2610,"area":"A_US"...
2020-01-25
已采納回答 / 小小新_Not_Found
視頻中的json數(shù)據(jù)video_rating.log是講師自己做的假數(shù)據(jù),目前也并沒有放入到下載資料中,你可以按照上一個視頻中的字段自己仿照做一個假數(shù)據(jù)<...圖片...>
2019-12-26
已采納回答 / 徐老師
提前進行map的局部聚合,會提高性能,因為聚合后map端通過shuffle發(fā)送到reduce端的數(shù)據(jù)就少了,對應的就減少了網(wǎng)絡傳輸?shù)臅r間
2019-12-26
講師回答 / 徐老師
執(zhí)行ssh-keygen是為了做免密碼登錄的,因為hadoop在啟動的時候默認會使用ssh 命令免密碼登錄到對應的機器啟動集群的相關服務,不管是單機還是集群都是這個流程
2019-12-21