我想將一個單獨的數(shù)據(jù)框 (df2) 與主數(shù)據(jù)框 (df1) 合并,但是如果對于給定的行,df1 中的日期在 df2 中不存在,則在 df1 中的基礎(chǔ)日期之前搜索最近的日期。我嘗試使用 pd.merge,但它會刪除日期不匹配的行,并且只保留在兩個 df 中匹配的行。df1 = [['2007-01-01','A'], ['2007-01-02','B'], ['2007-01-03','C'], ['2007-01-04','B'], ['2007-01-06','C']]df2 = [['2007-01-01','B',3], ['2007-01-02','A',4], ['2007-01-03','B',5], ['2007-01-06','C',3]]df1 = pd.DataFrame(df1)df2 = pd.DataFrame(df2)df1[0] = pd.to_datetime(df1[0])df2[0] = pd.to_datetime(df2[0])當(dāng)前 df1 | pd.merge(): 0 1 20 2007-01-06 C 3 只獲取兩個 df 之間的確切日期,它不考慮最近日期的值。預(yù)期 df1: 0 1 20 2007-01-01 A NaN1 2007-01-02 B 32 2007-01-03 C NaN3 2007-01-04 B 34 2007-01-06 C 3獲取 NaN,因為 df2 中該日期當(dāng)天或之前不存在數(shù)據(jù)。對于索引行 1,它獲取前一天之前的數(shù)據(jù),而索引行 4,它恰好獲取當(dāng)天的數(shù)據(jù)。
2 回答

呼喚遠(yuǎn)方
TA貢獻1856條經(jīng)驗 獲得超11個贊
使用檢查您的輸出 merge_asof
pd.merge_asof(df1,df2,on=0,by=1,allow_exact_matches=True)
Out[15]:
0 1 2
0 2007-01-01 A NaN
1 2007-01-02 B 3.0
2 2007-01-03 C NaN
3 2007-01-04 B 5.0 # here should be 5 since 5 ' date is more close. also df2 have two B
4 2007-01-06 C 3.0
添加回答
舉報
0/150
提交
取消