課程
/云計算&大數(shù)據(jù)
/大數(shù)據(jù)
/快速入門Hadoop3.0大數(shù)據(jù)處理
Map的局部聚合雖然是可選項,執(zhí)行局部聚合與不執(zhí)行局部聚合,對于全局數(shù)據(jù)的清洗到聚合的全流程來說,性能有影響嘛?
2019-12-26
源自:快速入門Hadoop3.0大數(shù)據(jù)處理 5-2
正在回答
提前進行map的局部聚合,會提高性能,因為聚合后map端通過shuffle發(fā)送到reduce端的數(shù)據(jù)就少了,對應(yīng)的就減少了網(wǎng)絡(luò)傳輸?shù)臅r間
舉報
快速入門Hadoop3.0數(shù)據(jù)處理,輕松邁入大數(shù)據(jù)領(lǐng)域
2 回答關(guān)于reduce變量共享問題
4 回答部署hadoop
1 回答中間數(shù)據(jù)存儲在map中,數(shù)據(jù)量大能能解決嗎?
3 回答關(guān)于啟動后的出現(xiàn)的服務(wù)數(shù)量
1 回答怎么安裝部署?
Copyright ? 2025 imooc.com All Rights Reserved | 京ICP備12003892號-11 京公網(wǎng)安備11010802030151號
購課補貼聯(lián)系客服咨詢優(yōu)惠詳情
慕課網(wǎng)APP您的移動學(xué)習(xí)伙伴
掃描二維碼關(guān)注慕課網(wǎng)微信公眾號
2020-01-05
提前進行map的局部聚合,會提高性能,因為聚合后map端通過shuffle發(fā)送到reduce端的數(shù)據(jù)就少了,對應(yīng)的就減少了網(wǎng)絡(luò)傳輸?shù)臅r間