-
Spark舉例說明
查看全部 -
舉例說明:
查看全部 -
Scala Shell:
查看全部 -
Python Shell
查看全部 -
Spark的Shell
查看全部 -
Spark目錄
查看全部 -
Spark下載
查看全部 -
Spark運行環(huán)境
查看全部 -
Hadoop與Spark的比較
查看全部 -
Spark應用場景
1、時效性要求高的場景
2、機器學習領(lǐng)域
查看全部 -
Hadoop應用場景
1、離線處理
2、對時效性要求不高。
查看全部 -
Spark組件具有緊密集成的優(yōu)點:
1、Spark底層優(yōu)化了,基于Spark底層的組件,也得到了相應的優(yōu)化。
2、緊密集成,節(jié)省了各個組件組合使用時的部署,測試等時間。
3、向Spark增加新的組件時,其他組件可以立刻享用新組件的功能。
查看全部 -
Clusters Managers:
就是集群管理,Spark自帶一個集群管理的單獨調(diào)度器。
常見的集群管理包括Hadoop YARN,Apache Mesos
查看全部 -
Graphx:
是處理圖的庫(例如,社交網(wǎng)絡圖),并進行圖的并行計算。像Spark Streaming,Spark SQL一樣,它也繼承了RDD API。
它提供了各種圖的操作,和常用的圖算法,例如PangeRank算法。
應用場景,圖計算。
查看全部 -
Mlib:
????一個包含通用機器學習功能的包,Machine learning lib。
包含分類,聚類,回歸等,還包括模型評估,和數(shù)據(jù)導入。
MLlib提供上面的這些方法,都支持集群上的橫向拓展。
應用場景:機器學習
查看全部
舉報