2 回答

TA貢獻(xiàn)1784條經(jīng)驗(yàn) 獲得超2個(gè)贊
您可以刪除Client
不測(cè)試缺失值百分比的列,通過 測(cè)試它們,用 replace sDataFrame.isna
聚合平均值以避免丟失它們,最后轉(zhuǎn)置通過:Client
NaN
DataFrame.T
print (df)
? ? ? ?id? ? ? type priority? ?Client
0? ? ?NaN? Incident? ? ? Low? client1
1? ? ?NaN? ? ? ?NaN? ? ?High? client1
2? 56 294? Incident? ? ? Nan? ? ? NaN
3? 56 197? ? ? ?NaN? ? ? Low? client3
4? ? ?NaN? ?Demande? ? ? NaN? client4
df = (df.drop('Client', 1)
? ? ? ? .isna()
? ? ? ? .groupby(df['Client'].fillna('NaN'))
? ? ? ? .mean()
? ? ? ? .rename_axis(None)
? ? ? ? .T)
print (df)
? ? ? ? ? NaN? client1? client3? client4
id? ? ? ? 0.0? ? ? 1.0? ? ? 0.0? ? ? 1.0
type? ? ? 0.0? ? ? 0.5? ? ? 1.0? ? ? 0.0
priority? 0.0? ? ? 0.0? ? ? 0.0? ? ? 1.0

TA貢獻(xiàn)1934條經(jīng)驗(yàn) 獲得超2個(gè)贊
據(jù)我所知,使用蠻力是可能的。我會(huì)嘗試使用isna函數(shù)和求和來估計(jì)每行或每列中 NaN 的數(shù)量,然后我會(huì)嘗試估計(jì)百分比。
添加回答
舉報(bào)