首頁猿問 pd.read_excel() 用...

pd.read_excel() 用 `nan` 字符串替換空格，pd.read_csv()

Python

小唯快跑啊 2021-11-23 19:01:54

當(dāng)我創(chuàng)建了一個DataFrame與pd.read_excel(my_excel_file, dtype=str)電子表格中的空白單元格被替換為字符串nan。另一方面，DataFrame從pd.read_csv(my_csv_file, dtype=str)用numpy.nan對象替換空白。為什么是這樣？

查看完整描述

2 回答

長風(fēng)秋雁

TA貢獻(xiàn)1757條經(jīng)驗獲得超7個贊

您可以為指定一個na_values屬性read_excel。

df = pd.read_excel(my_excel_file, na_values=[''], dtype=object)

反對回復(fù) 2021-11-23

慕標(biāo)5832272

TA貢獻(xiàn)1966條經(jīng)驗獲得超4個贊

我會試著回答你的問題，為什么是這樣？使用dtype=str讀取 Excel 文件時pd.read_excel，得到的結(jié)果與使用時得到的結(jié)果不一致pd.read_csv。主要原因或者您可以說，在使用numpy.nan時用對象替換空白單元格的優(yōu)勢pd.read_csv在于它便于您使用pd.isna，它僅適用于numpy.nan對象，否則僅適用于nan.

有很多關(guān)于這個的討論，可以說這個功能反過來允許在pd.read_csv和之間保持一致性pd.read_excel。您可以在 Pandas 的 Github 頁面上閱讀有關(guān)討論的更多信息，在read_excel中對此進(jìn)行了一些辯論，dtype=str 將空單元格轉(zhuǎn)換為字符串 'nan' #20377

反對回復(fù) 2021-11-23