第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號(hào)安全,請(qǐng)及時(shí)綁定郵箱和手機(jī)立即綁定
已解決430363個(gè)問題,去搜搜看,總會(huì)有你想問的

如何在不聚合原始 RDD 分區(qū)的情況下與多個(gè) RDD 進(jìn)行分組?

如何在不聚合原始 RDD 分區(qū)的情況下與多個(gè) RDD 進(jìn)行分組?

函數(shù)式編程 2022-04-27 13:07:35
我有兩個(gè) RDD 有公共變量,其格式如下: x = sc.parallelize([("A", 1), ("B", 4),("A",2)]) y = sc.parallelize([("A", -1),("B", 5)])然后我想使用公共變量與他們分組。"A"和"B"。我嘗試使用以下命令: z = [(x, tuple(map(list, y))) for x, y in sorted(list(x.cogroup(y).collect()))] print(z)我得到的是[('A', ([1, 2], [-1])), ('B', ([4], [5]))]但是,我想要的是[('A', ([1], [-1])), ('B', ([4], [5])),('A', ([2], [-1]))]如何更改代碼以獲得如上所示的輸出?謝謝你。
查看完整描述

1 回答

?
ibeautiful

TA貢獻(xiàn)1993條經(jīng)驗(yàn) 獲得超6個(gè)贊

您可以通過直接連接來做到這一點(diǎn):


print(x.join(y).collect())

#[('A', (1, -1)), ('A', (2, -1)), ('B', (4, 5))]

mapValues如果您希望 s 的元素為tuples,請(qǐng)?zhí)砑诱{(diào)用list:


print(x.join(y).mapValues(lambda a: tuple([b] for b in a)).collect())

#[('A', ([1], [-1])), ('A', ([2], [-1])), ('B', ([4], [5]))]


查看完整回答
反對(duì) 回復(fù) 2022-04-27
  • 1 回答
  • 0 關(guān)注
  • 115 瀏覽
慕課專欄
更多

添加回答

舉報(bào)

0/150
提交
取消
微信客服

購(gòu)課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)