首頁(yè) 猿問(wèn) 如何將包含 Excel...

如何將包含 Excel 序列日期和常規(guī)日期的列轉(zhuǎn)換為 pandas 日期時(shí)間？

Python

縹緲止盈 2023-08-22 14:54:11

我有一個(gè)數(shù)據(jù)框，其中的生日具有與 Excel 序列日期混合的常規(guī)日期，如下所示：09/01/2020 12:00:00 AM05/15/1985 12:00:00 AM06/07/2013 12:00:00 AM332332629929428我嘗試了此答案中的解決方案，所有 Excel 串行格式的日期都被清空，同時(shí)保留正常日期格式的日期。這是我的代碼：import pandas as pdimport xlrdimport numpy as npfrom numpy import *from numpy.core import *import osimport datetimefrom datetime import datetime, timedeltaimport globdef from_excel_ordinal(ordinal, _epoch0=datetime(1899, 12, 31)): if ordinal >= 60: ordinal -= 1 # Excel leap year bug, 1900 is not a leap year! return (_epoch0 + timedelta(days=ordinal)).replace(microsecond=0)path = 'C:\\Input'os.chdir(path)filelist = glob.glob('*BLAH*.xlsx') filename = os.fsdecode(filelist[0])df = pd.read_excel(filename, sheet_name = 'Blah Blah') m = df['Birthday'].astype(str).str.isdigit()df.loc[m, 'Birthday'] = df.loc[m, 'Birthday'].astype(int).apply(from_excel_ordinal)df['Birthday'] = pd.to_datetime(df['Birthday'], errors = 'coerce')我不確定我在哪里出了問(wèn)題，因?yàn)榇a不應(yīng)該像現(xiàn)在這樣清空生日。

查看完整描述

2 回答

嚕嚕噠

TA貢獻(xiàn)1784條經(jīng)驗(yàn) 獲得超7個(gè)贊

無(wú)法以相同的方式解析所有日期
加載數(shù)據(jù)框
如果尚未將該dates列轉(zhuǎn)換為 a，則將其轉(zhuǎn)換為 a。str
使用布爾索引選擇不同的日期類型
- 假設(shè)常規(guī)日期包含/
- 假設(shè) Excel 序列日期不包含/
根據(jù)日期時(shí)間類型分別修復(fù)每個(gè)數(shù)據(jù)幀
將數(shù)據(jù)幀重新連接在一起。

import pandas as pd

from datetime import datetime

# load data

df = pd.DataFrame({'dates': ['09/01/2020', '05/15/1985', '06/07/2013', '33233', '26299', '29428']})

# display(df)

? ? ? ? dates

0? 09/01/2020

1? 05/15/1985

2? 06/07/2013

3? ? ? ?33233

4? ? ? ?26299

5? ? ? ?29428

# set the column type as a str if it isn't already

df.dates = df.dates.astype('str')

# create a date mask based on the string containing a /

date_mask = df.dates.str.contains('/')

# split the dates out for excel

df_excel = df[~date_mask].copy()

# split the regular dates out

df_reg = df[date_mask].copy()

# convert reg dates to datetime

df_reg.dates = pd.to_datetime(df_reg.dates)

# convert excel dates to datetime; the column needs to be cast as ints

df_excel.dates = pd.TimedeltaIndex(df_excel.dates.astype(int), unit='d') + datetime(1900, 1, 1)

# combine the dataframes

df = pd.concat([df_reg, df_excel])

顯示(df)

? ? ? ?dates

0 2020-09-01

1 1985-05-15

2 2013-06-07

3 1990-12-28

4 1972-01-03

5 1980-07-28

反對(duì) 回復(fù) 2023-08-22

侃侃無(wú)極

TA貢獻(xiàn)2051條經(jīng)驗(yàn) 獲得超10個(gè)贊

pd.TimedeltaIndex(dates_in_excel_serial_format, 單位='d') + pd.datetime(1900,1,1)

演示：

> dates_in_excel_serial_format = [29428]

> pd.TimedeltaIndex(dates_in_excel_serial_format, unit='d') + pd.datetime(1900,1,1)

< DatetimeIndex(['1980-07-28'], dtype='datetime64[ns]', freq=None)

反對(duì) 回復(fù) 2023-08-22

2 回答
0 關(guān)注
1741 瀏覽

關(guān)注

添加回答

舉報(bào)

0/150

提交

取消

使用 Ctrl+D 可將網(wǎng)站添加到書(shū)簽

微信客服

購(gòu)課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)

第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

熱搜

最近搜索清空

如何將包含 Excel 序列日期和常規(guī)日期的列轉(zhuǎn)換為 pandas 日期時(shí)間？

如何將包含 Excel 序列日期和常規(guī)日期的列轉(zhuǎn)換為 pandas 日期時(shí)間？

2 回答

添加回答

如何將包含 Excel 序列日期和常規(guī)日期的列轉(zhuǎn)換為 pandas 日期時(shí)間？