那個hadoop分布式緩存設(shè)置應(yīng)該是這樣的
job.addCacheFile(new Uri(cache)) 不需要加入 conf
然后我覺得在step1 對列排序再輸出 對于第二步處理更快
job.addCacheFile(new Uri(cache)) 不需要加入 conf
然后我覺得在step1 對列排序再輸出 對于第二步處理更快
2017-09-22
有強迫癥的人,看著老師的map跟reduce處理中,完全不判斷字符串是不是為空,直接split表示很揪心
2017-09-22