我在一個文件夾中有許多具有相同列的 Excel 文件。我需要瀏覽每個文件并比較一個文件的“用戶編號”列的哪些值與另一個文件相同。然后基于該操作另一個名為“Date”的列。例如:A2018_02_01 file has: User_Number Date 18732A 2017-06-2227192B 2017-08-06 23872Z 2017-08-06 82716A 2017-09-18 77629B 2017-09-12 A2018_02_02 file has:User_Number Date18732A 2017-06-2227192B 2017-08-0654321R 2017-12-1123872Z 2017-11-0418732A 2017-06-25因此,在這種情況下,我希望程序檢查用戶編號值的匹配項,然后,如果一個文件的日期(鏈接到該編號)與另一個文件的日期不同,我想將兩個日期都更改為最舊的日期。在這種情況下,我會:A2018_02_01 file has: User_Number Date 18732A 2017-06-22 27192B 2017-08-06 23872Z 2017-08-06 82716A 2017-09-18 77629B 2017-09-12 A2018_02_02 file has:User_Number Date18732A 2017-06-2227192B 2017-08-0654321R 2017-12-1123872Z 2017-08-0618732A 2017-06-22我附加了所有文件:import osimport globimport pandas as pdpath=r'C/.../files'files = os.listdir(path)df = pd.DataFrame()for f in glob.glob(path + "/*.xlsx"): data = pd.read_excel(f,header=2) df=df.append(data) df["Date"]=pd.to_datetime(df["Date"], errors='coerce')該邏輯不像 javascript 邏輯那樣工作,所以我不確定如何做條件。我試過:df_number = df["User Number"]for number in df[df_number.duplicated()]: number.df["Date"]number.df["Date"].min()和其他方法一樣,但沒有任何效果。任何幫助表示贊賞。
添加回答
舉報
0/150
提交
取消