在线日韩av免费永久观看,99国产免费,freeexxx性欧美

首頁免費(fèi)課 Spark從零開始筆記

Spark從零開始

            
                Terby
            
            JAVA開發(fā)工程師
                    
                難度初級
            
                時長 2小時18分
            
                學(xué)習(xí)人數(shù)
            
綜合評分9.80
                            56人評價
                        查看評價
                                9.8
                                內(nèi)容實(shí)用
                            
                                9.7
                                簡潔易懂
                            
                                9.9
                                邏輯清晰

最熱最新

慕后端4477088 05:12

take（n）：
隨機(jī)取n個數(shù)

查看全部

0 采集收起來源：RDD基本操作之Action
2020-07-28
慕后端4477088 04:23

collect（）

查看全部

0 采集收起來源：RDD基本操作之Action
2020-07-28
慕后端4477088 01:04

:222222

查看全部

0 采集收起來源：RDD基本操作之Action
2020-07-28
慕后端4477088 00:57

rdd? action：

查看全部

0 采集收起來源：RDD基本操作之Action
2020-07-28
慕粉1446071354

后續(xù)課程：
Spark架構(gòu)
Spark運(yùn)行過程
Spark程序部署

查看全部

0 采集收起來源：Spark課程總結(jié)
2020-05-24
慕粉1446071354
combineByKey():
- (createCombiner, mergeValue, mergeCombiners, partitioner)
- 最常用的基于key的聚合函數(shù)，返回的類型可以與輸入類型不一樣。
- 許多基于key的聚合函數(shù)都用到了它，像groupByKey()
- 遍歷partition中的元素，元素的key，要么之前見過的，要么不是。
- 如果是新元素，使用我們提供的createCombiner()函數(shù)
- 如果是這個partition中已經(jīng)存在的key，就會使用mergeValue()函數(shù)
- 合并每個partition的結(jié)果的時候，使用mergeCombiners()函數(shù)
查看全部

0 采集收起來源：KeyValue對RDDs(二)
2020-05-24
慕粉1446071354

val rdd2 = rdd.map(line=>(line.split(" ")(0), line))

查看全部

0 采集收起來源：KeyValue對RDDs(一)
2020-05-24
慕粉1446071354

RDDs的血統(tǒng)關(guān)系圖
延遲計算
RDD.persist()

查看全部

0 采集收起來源：RDDS的特性
2020-05-24
慕粉1446071354

Action介紹：
在RDD上計算出來一個結(jié)果。
把結(jié)果返回給driver program或保存在文件系統(tǒng)，count()，save
rdd.reduce((x,y)=>x+y)

查看全部

0 采集收起來源：RDD基本操作之Action
2020-05-24
慕粉1446071354

集合運(yùn)算
RDDs支持?jǐn)?shù)學(xué)集合的計算，例如并集、交集等
val rdd_distinct = rdd1.distinct()
val rdd_union = rdd1.union(rdd2)
val rdd_inter = rdd1.intersection(rdd2)
val rdd_sub = rdd1.subtract(rdd2)

查看全部

1 采集收起來源：RDDs基本操作之Transformations（二）
2020-05-24
慕粉1446071354

Transformations介紹：
Transformations（轉(zhuǎn)換）
從之前的RDD構(gòu)建一個新的RDD，像map()和filter()

逐元素Transformations：
map()接收函數(shù)，把函數(shù)應(yīng)用到RDD的每一個元素，返回新RDD
filter()接收函數(shù)，返回只包含滿足filter()函數(shù)的元素的新RDD
flatMap()，對每個輸入元素，輸出多個輸出元素。flat壓扁的意思，將RDD中元素壓扁后返回一個新的RDD

val lines = inputs.flatMap(line=>line.split(" "))
lines.foreach(println)

查看全部

0 采集收起來源：RDDs基本操作之Transformations（一）
2020-05-24
慕粉1446071354

?
Driver Program
SparkContext
RDDs

查看全部

0 采集收起來源：Rdds介紹
2020-05-24
慕粉1446071354

WordCount程序開發(fā)

查看全部

0 采集收起來源：開發(fā)第一個Spark程序
2020-05-24
慕粉1446071354

默認(rèn)安裝選項會自動配置環(huán)境變量。
Spark 1.6.2 -- Scala 2.10?
Spark 2.0.0 -- Scala 2.11

IntelliJ IDEA常用的設(shè)置：
主題和顏色
編輯器界面字體設(shè)置
光標(biāo)所在行背景顏色

查看全部

1 采集收起來源：Spark開發(fā)環(huán)境搭建
2020-05-24
慕粉1446071354

Spark下載，安裝；
Spark Shell操作

查看全部

0 采集收起來源：spark安裝
2020-05-24