已采納回答 / 徐老師
現(xiàn)在hadoop也支持在win中部署了,它里面提供的也有對應(yīng)的cmd腳本,但是不建議在win中部署,意義不大,因為實際工作中都是在linux中部署的,所以建議在學(xué)習(xí)過程中就直接在linux中部署
2020-04-22
已采納回答 / 徐老師
我確認了一下,這兩個版本的目錄結(jié)構(gòu)沒有變化,本身這兩個版本就屬于一個大版本3.2.x,不會有特別大的改動的你是不是下載成源碼包了? 源碼包里面都是以Hadoop開頭的目錄例如:hadoop-3.2.1.tar.gz? 可以直接使用的安裝包hadoop-3.2.1-src.tar.gz 這個是源碼包
2020-04-16
講師回答 / 徐老師
如果搭建集群的那幾臺云服務(wù)器是在一個內(nèi)網(wǎng)網(wǎng)段的話 建議使用內(nèi)網(wǎng)ip,如果他們的內(nèi)網(wǎng)不通的話就只能使用外網(wǎng)了
2020-04-13
講師回答 / 徐老師
可以的,使用mac就不用使用linux虛擬機了,直接在mac上安裝hadoop即可,可能個別操作命令會有區(qū)別,大部分命令都是一樣的例如:關(guān)閉防火墻的操作和linux中不一樣
2020-04-08
講師回答 / 徐老師
是的? 針對這種獲取全局topN的案例,reduce任務(wù)只能有一個,這樣才是全局的?
已采納回答 / 徐老師
可以有這些方案1:如果內(nèi)存中存放下,可以考慮增加這個任務(wù)的內(nèi)存2:或者可以考慮外部存儲,例如:redis,把這些數(shù)據(jù)存放到redis中,這樣針對一些需要在內(nèi)存中產(chǎn)生很多中間臨時結(jié)果的場景也是很適用的
講師回答 / 徐老師
這里沒法上傳文件,我把數(shù)據(jù)格式給你發(fā)一部分哈,你可以參考這個格式?{"id":"158008900435","uid":"120010010445","nickname":"jack435","gold":445,"watchnumpv":4350,"watchnumuv":870,"hots":1305,"nofollower":435,"looktime":8700,"smlook":2175,"follower":1740,"gifter":870,"length":2610,"area":"A_U...
2020-03-16
講師回答 / 徐老師
下載失敗一般是由于網(wǎng)絡(luò)問題導(dǎo)致的首先去本地的maven倉庫找到之前下載的hadoop-client,把這個目錄直接刪除掉,因為有可能有個別jar包之前由于網(wǎng)絡(luò)原因?qū)е孪螺d的不完整然后可以修改maven的鏡像地址,可以改為阿里云的配置文件在apache-maven-3.x.x\conf\settings.xml<mirrors>
? ?????<mirror>
? ? ? ?????????<id>alimaven</id>
? ? ? ??????...
2020-02-27
講師回答 / 徐老師
在實際開發(fā)中可以使用root,當(dāng)然創(chuàng)建一個獨立的新用戶,例如:hadoop用戶會更好,主要是基于權(quán)限控制方面的考慮
2020-02-23
講師回答 / 徐老師
failed on connection exception: java.net.ConnectException:? 是連接拒絕的意思,表示這臺機器上的hadoop服務(wù)沒有啟動,或者是啟動失敗了,你可以jps查看一下,進程是否都在,如果不在的話需要查看日志排查一下為什么啟動失敗了
2020-02-15