首頁猿問 Spark Java 重新分區(qū)

Spark Java 重新分區(qū)

Java

Smart貓小萌 2023-05-10 13:41:08

Java spark2這兩個語句有什么區(qū)別-Dataset<Row> Data; Data.repartition(new Column("key" )) ; and Data.repartition(Data.col("key" ) ;

查看完整描述

1 回答

千巷貓影

TA貢獻(xiàn)1829條經(jīng)驗獲得超7個贊

正在做

Data.repartition(new?Column("key"));

相當(dāng)于

import?static?org.apache.spark.sql.functions.col;
Data.repartition(col("key"));

在這些情況下，該列不直接與數(shù)據(jù)集相關(guān)聯(lián)，Spark 需要在分析階段解析它。

如果你改用

Data.repartition(Data.col("key");

您正在向 Spark 發(fā)出指令，該指令是該列所屬的數(shù)據(jù)集。此方法主要用于連接，例如，您可以擁有兩個具有公共列名的數(shù)據(jù)集。

在您的示例中，結(jié)果是等效的，您可以使用兩種形式。

反對回復(fù) 2023-05-10

關(guān)注

舉報

0/150

提交

取消

購課補貼
聯(lián)系客服咨詢優(yōu)惠詳情

慕課網(wǎng)APP
您的移動學(xué)習(xí)伙伴

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號