第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號(hào)安全,請(qǐng)及時(shí)綁定郵箱和手機(jī)立即綁定
已解決430363個(gè)問題,去搜搜看,總會(huì)有你想問的

如何使用 Spark 更改所有數(shù)據(jù)集中的非數(shù)值?

如何使用 Spark 更改所有數(shù)據(jù)集中的非數(shù)值?

瀟瀟雨雨 2022-10-07 16:17:28
我正在使用一個(gè)包含很多列的數(shù)據(jù)集,這個(gè)數(shù)據(jù)集有?在所有數(shù)據(jù)集中。我想用 Spark (Java) 來改變 ? 到 0。到目前為止,我只能用一列做到這一點(diǎn),但我想在任何地方都這樣做:    Dataset<Row> csvData = spark.read()            .option("header", false)            .option("inferSchema", true)            .option("maxColumns", 50000)            .csv("src/main/resources/K9.data");    csvData = csvData.withColumn("_c5409", when(col("_c5409").isNull(),0).otherwise(col("_c5409")) )        .withColumn("_c0", when(col("_c0").equalTo("?"),0).otherwise(col("_c0")) );也許這有一個(gè)簡單的解決方案,我是 Java 和 Spark 的新手 :)
查看完整描述

1 回答

?
UYOU

TA貢獻(xiàn)1878條經(jīng)驗(yàn) 獲得超4個(gè)贊

您可以使用 when 創(chuàng)建列列表,并在 select 中使用它是否必須處理復(fù)雜的 if 和 else 情況


List<org.apache.spark.sql.Column> list = new ArrayList<org.apache.spark.sql.Column>();

for( String col : csvData.columns()){

    list.add(when(csvData.col(col).isNull(),0).otherwise(csvData.col(col)).alias(col));

}

csvData = csvData.select(list.toArray(new org.apache.spark.sql.Column[0]));


如果只是簡單地替換空值,這就足夠了


csvData = csvData.na().fill(0, df.columns()); 


查看完整回答
反對(duì) 回復(fù) 2022-10-07
  • 1 回答
  • 0 關(guān)注
  • 86 瀏覽

添加回答

舉報(bào)

0/150
提交
取消
微信客服

購課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)