第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號(hào)安全,請(qǐng)及時(shí)綁定郵箱和手機(jī)立即綁定
已解決430363個(gè)問(wèn)題,去搜搜看,總會(huì)有你想問(wèn)的

Spark RDD 和 Dataframe 轉(zhuǎn)換優(yōu)化

Spark RDD 和 Dataframe 轉(zhuǎn)換優(yōu)化

函數(shù)式編程 2023-05-09 14:49:52
我是 Spark 的新手,有以下關(guān)于 RDD 和 Dataframes 的高級(jí)問(wèn)題,如果我沒(méi)記錯(cuò)的話,它們是建立在 RDD 之上的:我知道有兩種類型的操作可以在 RDD 上完成,轉(zhuǎn)換和操作。我還了解到,僅當(dāng)對(duì)作為該轉(zhuǎn)換產(chǎn)物的 RDD 執(zhí)行操作時(shí)才執(zhí)行轉(zhuǎn)換。鑒于 RDD 在內(nèi)存中,我想知道是否有可能優(yōu)化這些 RDD 消耗的內(nèi)存量,請(qǐng)看以下示例:KafkaDF = KafkaDFRaw.select(        KafkaDFRaw.key,        KafkaDFRaw.value,        KafkaDFRaw.topic,        unix_timestamp('timestamp',                       'yyyy-MM-dd HH:mm:ss').alias('kafka_arrival_time')    ).withColumn("spark_arrival_time", udf(time.time, DoubleType())())我有一個(gè) KafkaDFRaw 數(shù)據(jù)框,我生成了一個(gè)名為 KafkaDF 的新 RDD。然后我希望向這個(gè)新的 RDD 添加列。我應(yīng)該將它們添加到現(xiàn)有的 RDD 中嗎?像這樣:decoded_value_udf = udf(lambda value: value.decode("utf-8"))    KafkaDF = KafkaDF\        .withColumn(            "cleanKey", decoded_value_udf(KafkaDF.key))\        .withColumn(            "cleanValue", decoded_value_udf(KafkaDF.value))或者我應(yīng)該從上一個(gè)數(shù)據(jù)框創(chuàng)建一個(gè)新的數(shù)據(jù)框嗎?像這樣:decoded_value_udf = udf(lambda value: value.decode("utf-8"))    KafkaDF_NEW = KafkaDF\        .withColumn(            "cleanKey", decoded_value_udf(KafkaDF.key))\        .withColumn(            "cleanValue", decoded_value_udf(KafkaDF.value))這對(duì)內(nèi)存優(yōu)化有影響嗎?預(yù)先感謝您的幫助。
查看完整描述

1 回答

?
MYYA

TA貢獻(xiàn)1868條經(jīng)驗(yàn) 獲得超4個(gè)贊

每當(dāng)調(diào)用操作時(shí),都會(huì)執(zhí)行優(yōu)化的 dag 并按照計(jì)劃使用內(nèi)存。您可以比較執(zhí)行計(jì)劃以了解:

df.explain(true)
df_new.explain(true)

在兩者之間創(chuàng)建額外的變量來(lái)保存轉(zhuǎn)換不會(huì)影響內(nèi)存利用率。內(nèi)存要求將取決于數(shù)據(jù)大小、分區(qū)大小、隨機(jī)播放等。


查看完整回答
反對(duì) 回復(fù) 2023-05-09
  • 1 回答
  • 0 關(guān)注
  • 175 瀏覽
慕課專欄
更多

添加回答

舉報(bào)

0/150
提交
取消
微信客服

購(gòu)課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)