我一直在研究一個簡單的 wordcount 程序,該程序在輸入文本時打印出每個單詞的出現次數。reduce 函數如下所示:def reducer(self, word, count): yield(word, sum(count))上面的 reducer() 可以正確地計算輸入文本文件中每個單詞的出現次數?,F在,我想調整 reduce() 函數,以便在輸出文件中只打印出現 10 次或更多的單詞。我想,它可能是這樣的:def reducer(self, word, count): if sum(count)>10: emit(word,sum(count))然而這行不通。相反,生成的輸出文件按每個單詞打印 0。我很確定 reducer() 函數需要調整,而不是 map 函數。但是,除了包含 if 語句之外,我想不出任何其他內容。我真的很感激一些建議。
添加回答
舉報
0/150
提交
取消