第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

請問如何將RDD拆分為兩個或多個RDD?

請問如何將RDD拆分為兩個或多個RDD?

蠱毒傳說 2019-08-03 03:03:26
如何將RDD拆分為兩個或多個RDD?我正在尋找一種將RDD分割成兩個或多個RDD的方法。我最近看到的是ScalaSPark:將集合拆分成幾個RDD?仍然是一個單一的RDD。如果您熟悉SAS,如下所示:data work.split1, work.split2;     set work.preSplit;     if (condition1)         output work.split1     else if (condition2)         output work.split2 run;這就產(chǎn)生了兩個不同的數(shù)據(jù)集。必須立即堅持才能得到我想要的結(jié)果.。
查看完整描述

3 回答

?
函數(shù)式編程

TA貢獻1807條經(jīng)驗 獲得超9個贊

一種方法是使用自定義分區(qū)程序根據(jù)篩選條件對數(shù)據(jù)進行分區(qū)。這可以通過擴展Partitioner并實現(xiàn)類似于RangePartitioner.

然后,可以使用映射分區(qū)從分區(qū)RDD構(gòu)造多個RDD,而無需讀取所有數(shù)據(jù)。

val filtered = partitioned.mapPartitions { iter => {

  new Iterator[Int](){
    override def hasNext: Boolean = {
      if(rangeOfPartitionsToKeep.contains(TaskContext.get().partitionId)) {
        false
      } else {
        iter.hasNext      }
    }

    override def next():Int = iter.next()
  }

請注意,篩選的RDD中的分區(qū)數(shù)將與分區(qū)RDD中的分區(qū)數(shù)相同,因此應(yīng)該使用合并來減少這一點,并刪除空分區(qū)。



查看完整回答
反對 回復 2019-08-04
  • 3 回答
  • 0 關(guān)注
  • 1150 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動學習伙伴

公眾號

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號