-
Apache Spark 是專為大規(guī)模數(shù)據(jù)處理而設(shè)計(jì)的快速通用的計(jì)算引擎。
查看全部 -
spark查看全部
-
python-shell scala-shell查看全部
-
map()接收函數(shù),把函數(shù)應(yīng)用到RDD的每一個(gè)元素,返回新的RDD
filter()接受函數(shù)返回只包含滿足filter()函數(shù)的元素的薪RDD? 例如只包含hello的list
flatMap()對每個(gè)輸入元素,輸出多個(gè)元素,將RDD元素壓扁后返回一個(gè)新的RDD,spilt切割空格,他會(huì)將3行壓扁為一行進(jìn)行處理
查看全部 -
版本查看全部
-
Spark的含義:是一個(gè)快速且通用的集群計(jì)算平臺(tái)
Spark的特點(diǎn):
spark是快速的
spark是通用的
spark是高度開放的
查看全部 -
23232
查看全部 -
Spark不具有HDFS的存儲(chǔ)能力。
查看全部 -
Spark組件--緊密集成
查看全部 -
Spark組件--Cluster Managers
查看全部 -
Spark組件--Graphx
查看全部 -
Spark組件--Mlib
查看全部 -
Spark組件--Spark Streaming
查看全部 -
Spark組件--Spark SQL
查看全部 -
Spark組件--Spark Core
查看全部
舉報(bào)