當(dāng)我創(chuàng)建了一個DataFrame與pd.read_excel(my_excel_file, dtype=str)電子表格中的空白單元格被替換為字符串nan。另一方面,DataFrame從pd.read_csv(my_csv_file, dtype=str)用numpy.nan對象替換空白。為什么是這樣?
2 回答

長風(fēng)秋雁
TA貢獻(xiàn)1757條經(jīng)驗 獲得超7個贊
您可以為 指定一個na_values
屬性read_excel
。
df = pd.read_excel(my_excel_file, na_values=[''], dtype=object)

慕標(biāo)5832272
TA貢獻(xiàn)1966條經(jīng)驗 獲得超4個贊
我會試著回答你的問題,為什么是這樣?使用dtype=str
讀取 Excel 文件時pd.read_excel
,得到的結(jié)果與使用時得到的結(jié)果不一致pd.read_csv
。主要原因或者您可以說,在使用numpy.nan
時用對象替換空白單元格的優(yōu)勢pd.read_csv
在于它便于您使用pd.isna
,它僅適用于numpy.nan
對象,否則僅適用于nan
.
有很多關(guān)于這個的討論,可以說這個功能反過來允許在pd.read_csv
和之間保持一致性pd.read_excel
。您可以在 Pandas 的 Github 頁面上閱讀有關(guān)討論的更多信息,在read_excel中對此進(jìn)行了一些辯論,dtype=str 將空單元格轉(zhuǎn)換為字符串 'nan' #20377
添加回答
舉報
0/150
提交
取消