3 回答

TA貢獻(xiàn)1884條經(jīng)驗(yàn) 獲得超4個(gè)贊
另一種方法spark 2.1.0
是--conf spark.driver.userClassPathFirst=true
在spark-submit期間使用,它通過(guò)優(yōu)先使用用戶(hù)添加到帶有--jars
選項(xiàng)的類(lèi)路徑的jar來(lái)改變依賴(lài)性加載的優(yōu)先級(jí),從而改變spark-job的行為。

TA貢獻(xiàn)1825條經(jīng)驗(yàn) 獲得超6個(gè)贊
與jar和classpath相關(guān)的其他可配置Spark選項(xiàng),在yarn
部署模式的情況下如下所示
從spark文檔中,
spark.yarn.jars
包含要分發(fā)到Y(jié)ARN容器的Spark代碼的庫(kù)列表。默認(rèn)情況下,YARN上的Spark將使用本地安裝的Spark jar,但Spark jar也可以位于HDFS上的世界可讀位置。這允許YARN將其緩存在節(jié)點(diǎn)上,這樣每次應(yīng)用程序運(yùn)行時(shí)都不需要分發(fā)它。例如,要指向HDFS上的jar,請(qǐng)將此配置設(shè)置為hdfs:/// some / path。允許使用全球。
spark.yarn.archive
包含所需Spark Spark的存檔,以便分發(fā)到Y(jié)ARN緩存。如果設(shè)置,則此配置將替換spark.yarn.jars,并且該存檔將用于所有應(yīng)用程序的容器中。存檔應(yīng)在其根目錄中包含jar文件。與之前的選項(xiàng)一樣,存檔也可以托管在HDFS上以加速文件分發(fā)。
用戶(hù)可以配置此參數(shù)以指定其jar,其中包含在Spark驅(qū)動(dòng)程序的類(lèi)路徑中。
添加回答
舉報(bào)