通过pandas merge_asof模糊匹配,快速计算财务同比指标
下面是一个工具函数,使用函数merge_asof,这个模糊匹配的逻辑是固定的,用右边的数据匹配左边的对应的数据
其中direction="backward"表示匹配规则是找小于等于目标日期的最近日期:
import pandas as pddef get_previous_year_data(df, date_col='date', value_col='value'):"""使用merge_asof快速匹配去年同期数据"""df = df.copy()df[date_col] = pd.to_datetime(df[date_col])df = df.sort_values(date_col).reset_index(drop=True)# 创建去年同期日期列df['previous_year_date'] = df[date_col] - pd.DateOffset(years=1)# 使用merge_asof进行最近匹配result_df = pd.merge_asof(df,df[[date_col, value_col]].rename(columns={date_col: 'previous_year_date', value_col: 'previous_year_value'}),on='previous_year_date',direction='backward') # 右边跟左边做匹配,选择左边的 on这一列,在右边找对应的匹配行的数据,# direction选择backward表示匹配规则是找小于等于目标日期的最近日期return result_dfdef main():# 使用示例data = {'date': ['2020-01-15', '2020-03-20', '2020-05-10', '2021-01-15', '2021-02-28', '2021-05-10', '2021-07-01', '2022-01-15','2022-03-15', '2022-05-10', '2022-08-20'],'value': [100, 150, 200, 110, 160, 210, 250, 120, 170, 220, 280]}result_fast = get_previous_year_data(pd.DataFrame(data))print(result_fast)if __name__ == '__main__':main()
得到结果:

