首頁猿問函數(shù)編程中的reduce和fold...

函數(shù)編程中的reduce和foldLeft / fold之間的區(qū)別

源碼

大話西游666 2019-11-23 12:45:24

為什么Scala和Spark和Scalding等框架同時具有reduce和foldLeft？那么，reduce和之間有什么區(qū)別fold？

查看完整描述

3 回答

月關(guān)寶盒

TA貢獻1772條經(jīng)驗獲得超5個贊

foldApache Spark中的內(nèi)容與fold未分發(fā)的集合中的內(nèi)容不同。實際上，它需要交換函數(shù)才能產(chǎn)生確定性的結(jié)果：

這與以Scala之類的功能語言為非分布式集合實現(xiàn)的折疊操作有些不同。該折疊操作可以單獨應(yīng)用于分區(qū)，然后將那些結(jié)果折疊為最終結(jié)果，而不是以某些定義的順序?qū)⒄郫B應(yīng)用于每個元素。對于非交換函數(shù)，結(jié)果可能與應(yīng)用于非分布式集合的折疊結(jié)果不同。

Mishael Rosenthal 已證明了這一點，Make42在其評論中建議了這一點。

有人建議觀察到的行為與HashPartitioner何時parallelize不洗牌和不使用有關(guān)HashPartitioner。

import org.apache.spark.sql.SparkSession

/* Note: standalone (non-local) mode */

val master = "spark://...:7077"

val spark = SparkSession.builder.master(master).getOrCreate()

/* Note: deterministic order */

val rdd = sc.parallelize(Seq("a", "b", "c", "d"), 4).sortBy(identity[String])

require(rdd.collect.sliding(2).forall { case Array(x, y) => x < y })

/* Note: all posible permutations */

require(Seq.fill(1000)(rdd.fold("")(_ + _)).toSet.size == 24)

解釋：

foldRDD的結(jié)構(gòu)

def fold(zeroValue: T)(op: (T, T) => T): T = withScope {

var jobResult: T

val cleanOp: (T, T) => T

val foldPartition = Iterator[T] => T

val mergeResult: (Int, T) => Unit

sc.runJob(this, foldPartition, mergeResult)

jobResult

}

與RDD的結(jié)構(gòu)reduce相同：

def reduce(f: (T, T) => T): T = withScope {

val cleanF: (T, T) => T

val reducePartition: Iterator[T] => Option[T]

var jobResult: Option[T]

val mergeResult = (Int, Option[T]) => Unit

sc.runJob(this, reducePartition, mergeResult)

jobResult.getOrElse(throw new UnsupportedOperationException("empty collection"))

}

在runJob不考慮分區(qū)順序的情況下執(zhí)行，導致需要交換功能。

foldPartition并且reducePartition在處理順序上有效，reduceLeft并且foldLeft在上有效執(zhí)行（通過繼承和委派）TraversableOnce。

結(jié)論：foldRDD不能依賴于塊的順序，而是需要可交換性和關(guān)聯(lián)性。

反對回復(fù) 2019-11-23

3 回答
0 關(guān)注
1088 瀏覽

關(guān)注

添加回答

舉報

0/150

提交

取消

使用 Ctrl+D 可將網(wǎng)站添加到書簽

微信客服

購課補貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動學習伙伴

公眾號

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號

第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

熱搜

最近搜索清空

函數(shù)編程中的reduce和foldLeft / fold之間的區(qū)別

函數(shù)編程中的reduce和foldLeft / fold之間的區(qū)別

3 回答

添加回答