第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號安全,請及時綁定郵箱和手機(jī)立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

如何通過鍵合并兩個PCollection KV<>?

如何通過鍵合并兩個PCollection KV<>?

DIEA 2023-07-13 14:39:16
我試圖輸出同一個鍵的 SUM 和 COUNT 。例如。給定一個包含數(shù)百萬個飛機(jī)延誤事件的 .csv。使用 Apache Beam (Java),我想對每架飛機(jī)的延誤持續(xù)時間進(jìn)行求和,并計算每架飛機(jī)的延誤次數(shù)。每行都有plane_id, delay_duration, date等我正在嘗試創(chuàng)建兩個 PCollection,并希望在輸出之前將它們合并。PCollection<KV<String, Integer>> sum =  eventInfo.apply(MapElements.into(TypeDescriptors.kvs(TypeDescriptors.strings(),TypeDescriptors.integers())).via((Event.EventInfo gInfo) -> KV.of(gInfo.getKey('plane_id'), gInfo.getDuration()))).apply(Sum.integersPerKey()); PCollection<KV<String, Long>> count =  eventInfo.apply(MapElements.into(TypeDescriptors.kvs(TypeDescriptors.strings(), TypeDescriptors.integers())).via((Event.EventInfo gInfo) -> KV.of(gInfo.getKey('plane_id'), gInfo.getDuration()))).apply(Count.perKey());這兩個 PCollection 按預(yù)期工作,但我不知道如何在 3 列中輸出它(合并它?)總和| 數(shù)數(shù)。
查看完整描述

1 回答

?
楊__羊羊

TA貢獻(xiàn)1943條經(jīng)驗 獲得超7個贊

您將需要CoGBK,它將幫助您共同定位總和并計算相同的密鑰。



查看完整回答
反對 回復(fù) 2023-07-13
  • 1 回答
  • 0 關(guān)注
  • 127 瀏覽

添加回答

舉報

0/150
提交
取消
微信客服

購課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動學(xué)習(xí)伙伴

公眾號

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號