如果我寫這段代碼:train['id_03'].value_counts(dropna=False, normalize =True).head()我正進(jìn)入(狀態(tài)NaN 0.8876892335828220.0 0.1082111287973721.0 0.0014613743353543.0 0.0011311680834492.0 0.000712906831036Name: id_03, dtype: float64如果我改變了 dropna =True我明白了0.0 0.9634971.0 0.0130123.0 0.0100722.0 0.0063485.0 0.001643Name: id_03, dtype: float64
2 回答

米琪卡哇伊
TA貢獻(xiàn)1998條經(jīng)驗(yàn) 獲得超6個(gè)贊
我認(rèn)為關(guān)鍵是您指定normalize =True
它是:"If True then the object returned will contain the relative frequencies of the unique values."
根據(jù)文檔。
在您刪除 Na 之前,Na 的計(jì)數(shù)用于計(jì)算相對(duì)頻率,在您刪除它們之后,相對(duì)頻率的分母發(fā)生了變化,因此值發(fā)生了變化

神不在的星期二
TA貢獻(xiàn)1963條經(jīng)驗(yàn) 獲得超6個(gè)贊
您正在對(duì)結(jié)果進(jìn)行規(guī)范化。的值NaN
相對(duì)于其他值似乎非常大。因此,其他索引導(dǎo)致的數(shù)字非常小
如果您查看索引 1 和 2 之間的相對(duì)比率,您會(huì)發(fā)現(xiàn)它們?cè)趦蓚€(gè)結(jié)果中是等效的。
添加回答
舉報(bào)
0/150
提交
取消