最贊回答 / 貝加爾湖畔v
c1和c2不是代表只有兩個(gè)partition,可以把這兩個(gè)當(dāng)做輸入的參數(shù),類似于reduce函數(shù)。c1代表前幾個(gè)partition已經(jīng)累計(jì)計(jì)算到的值,c2代表新partition的值。
2018-03-11
最贊回答 / 慕斯2517945
就是同一個(gè)東西,只是不同的角度,DAG,是從圖論的角度,血統(tǒng)關(guān)系圖是從數(shù)據(jù)依賴關(guān)系的角度
2017-12-24
最新回答 / qq_蛻變_33
不用吧,直接用“”把文件路徑括起來就好了,像這樣val rdd = sc.textFile("C:\\Users\\Desktop\\Test.txt")
2017-12-12
最贊回答 / Leco
內(nèi)個(gè)需要自己添加 ...? ?也可以不使用SBT添加依賴jar,打開你spark安裝目錄下/spark-2.1.1/jars檢索spark-core.jar這個(gè)名字就會(huì)找到對(duì)應(yīng)的jar包將這個(gè)jar包導(dǎo)入到工程里就可以了?
2017-09-30
最新回答 / 執(zhí)著的青蛙
你創(chuàng)建的是JAVA項(xiàng)目才會(huì)生成JAVA目錄,現(xiàn)在創(chuàng)建的是Scala項(xiàng)目,所以生成的是Scala目錄。這個(gè)是正確的
2017-09-04
最新回答 / mickeychen
用textFile加載本地文件時(shí)你試試這樣寫sc.textFile("/home/hadoop/2.txt")路徑前面就別加 " file:// " 試試,我寫的時(shí)候就沒加,可以讀取到本地文件
2017-08-29