首頁猿問 Pyspark 中的...

Pyspark 中的 None/== vs Null/isNull？

Python

萬千封印 2023-03-16 15:59:01

有什么區(qū)別：F.when(F.col('Name').isNull())和：F.when(F.col('Name') == None)它們的作用似乎不同。在檢查列中的空值時(shí)，第一個(gè)似乎效果更好。有時(shí)第二種方法不適用于檢查空名稱。例如，如果我想檢查 null 值并將 null 的名稱替換為“Missing name”或其他內(nèi)容，則第二種方法有時(shí)不會(huì)執(zhí)行任何操作。我不確定為什么它有時(shí)有效而其他時(shí)間無效。但是第一種方法總是有效的。

查看完整描述

3 回答

慕村225694

TA貢獻(xiàn)1880條經(jīng)驗(yàn) 獲得超4個(gè)贊

F.when(F.col('Name') == None)

None 是 python 中的對象，NoneType. 它與空字符串或 0 不同。對于這種情況，您可能希望使用

F.when(F.col('Name') is None)

使用==你正在檢查F.col('Name')value 是否等于 None 對象，它會(huì)把東西扔掉。

反對回復(fù) 2023-03-16

千巷貓影

TA貢獻(xiàn)1829條經(jīng)驗(yàn) 獲得超7個(gè)贊

請參閱此處：使用 None 值過濾 Pyspark 數(shù)據(jù)框列

基于相等的與 NULL 的比較將不起作用，因?yàn)樵?SQL 中 NULL 是未定義的，因此任何將其與另一個(gè)值進(jìn)行比較的嘗試都會(huì)返回 NULL

反對回復(fù) 2023-03-16

吃雞游戲

TA貢獻(xiàn)1829條經(jīng)驗(yàn) 獲得超7個(gè)贊

在數(shù)據(jù)世界中，兩個(gè)Null值（或兩個(gè)值None）并不相同。

因此，如果您對兩個(gè)值執(zhí)行==or!=操作None，它總是會(huì)產(chǎn)生False. 這是構(gòu)建功能的isNull()關(guān)鍵原因。isNotNull()

請看下面的例子以便更好地理解 -

創(chuàng)建一個(gè)dataframe具有少量有效記錄和一個(gè)記錄的None

from pyspark.sql.types import *

from pyspark.sql import Row

from pyspark.sql.functions import col

lst = [(1,'sometext'),(2,''),(3, None),(4, 'someothertext')]

myrdd = sc.parallelize(lst).map(lambda x: Row(id=x[0], txt=x[1]))

mydf= sqlContext.createDataFrame(myrdd)

isNull()返回True第 3 行，因此下面的語句返回一行 -

mydf.filter(col("txt").isNull()).show(truncate=False)

+---+----+

|id |txt |

+---+----+

|3 |null|

+---+----+

==運(yùn)算符返回False第 3 行，因此沒有記錄被過濾掉。

mydf.filter(col("txt") == None).show(truncate=False)

+---+---+

|id |txt|

+---+---+

反對回復(fù) 2023-03-16

3 回答
0 關(guān)注
303 瀏覽

關(guān)注

添加回答

舉報(bào)

0/150

提交

取消

使用 Ctrl+D 可將網(wǎng)站添加到書簽

微信客服

購課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號

第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

熱搜

最近搜索清空

Pyspark 中的 None/== vs Null/isNull？

Pyspark 中的 None/== vs Null/isNull？

3 回答

添加回答

Pyspark 中的 None/== vs Null/isNull？

Pyspark 中的 None/== vs Null/isNull？