第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號(hào)安全,請(qǐng)及時(shí)綁定郵箱和手機(jī)立即綁定
已解決430363個(gè)問題,去搜搜看,總會(huì)有你想問的

使用 Apache Beam 進(jìn)行內(nèi)存處理

使用 Apache Beam 進(jìn)行內(nèi)存處理

Go
守著星空守著你 2022-06-21 16:48:29
我正在運(yùn)行我自己的 GRPC 服務(wù)器,收集來自各種數(shù)據(jù)源的事件。服務(wù)器是用 Go 開發(fā)的,所有事件源都以預(yù)定義的格式將事件作為 protobuf 消息發(fā)送。我想做的是用內(nèi)存中的 Apache Beam 處理所有這些事件。我查看了 Apache Beam 的文檔,但找不到可以執(zhí)行我想要的操作的示例。我不會(huì)使用 Kafka、Flink 或任何其他流媒體平臺(tái),只是處理內(nèi)存中的消息并輸出結(jié)果。有人可以告訴我開始編寫簡(jiǎn)單的流處理應(yīng)用程序的正確方法嗎?
查看完整描述

1 回答

?
MMTTMM

TA貢獻(xiàn)1869條經(jīng)驗(yàn) 獲得超4個(gè)贊

好的,首先,Apache Beam 不是一個(gè)數(shù)據(jù)處理引擎,它是一個(gè) SDK,它允許您創(chuàng)建一個(gè)統(tǒng)一的管道并在不同的引擎上運(yùn)行它,比如 Spark、Flink、Google Dataflow 等。所以,運(yùn)行一個(gè) Beam 管道您將需要利用任何支持的數(shù)據(jù)處理引擎或使用DirectRunner,它將在本地運(yùn)行您的管道,但是(?。┧泻芏嘞拗疲⑶抑饕菫榱藴y(cè)試目的而開發(fā)的。

與 Beam 中的每個(gè)管道一樣,必須有一個(gè)源轉(zhuǎn)換(有界或無界),它將從您的數(shù)據(jù)源中讀取數(shù)據(jù)。我可以猜測(cè),在您的情況下,您的 GRPC 服務(wù)器應(yīng)該重新傳輸收集的事件。因此,對(duì)于源轉(zhuǎn)換,您可以使用已經(jīng)實(shí)現(xiàn)的Beam IO 轉(zhuǎn)換(IO 連接器)或創(chuàng)建自己的轉(zhuǎn)換,因?yàn)?Beam 中目前沒有 GrpcIO 或類似的東西。

關(guān)于內(nèi)存中的處理數(shù)據(jù),我不確定我是否完全理解您的意思。它主要取決于使用的數(shù)據(jù)處理引擎,因?yàn)樽罱K,您的 Beam 管道將在實(shí)際運(yùn)行之前轉(zhuǎn)換為例如 Spark 或 Flink 管道(如果您使用SparkRunnerFlinkRunner相應(yīng)地),然后數(shù)據(jù)處理引擎將管理管道工作流。大多數(shù)現(xiàn)代引擎盡最大努力將所有處理過的數(shù)據(jù)保存在內(nèi)存中,并僅在最后的手段將其刷新到磁盤上。


查看完整回答
反對(duì) 回復(fù) 2022-06-21
  • 1 回答
  • 0 關(guān)注
  • 136 瀏覽
慕課專欄
更多

添加回答

舉報(bào)

0/150
提交
取消
微信客服

購(gòu)課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)