当前位置: 首页 > news >正文

pandas中基于范围条件进行表连接

表连接是我们日常开展数据分析过程中很常见的操作,在pandas中基于join()merge()等方法,可以根据左右表连接依赖字段之间对应值是否相等,来实现常规的表连接。

但在有些情况下,我们可能需要基于一些“特殊”的条件匹配,来完成左右表之间的表连接操作,譬如对于下面的示例数据框demo_leftdemo_right

假如我们需要基于demo_leftleft_id等于demo_rightright_id,且demo_leftdatetimedemo_rightdatetime之间相差不超过7天,这样的条件来进行表连接,「通常的做法」是先根据left_idright_id进行连接,再在初步连接的结果表中基于left_idright_id进行分组筛选运算,过滤掉时间差大于7天的记录:

而除了上面的方式以外,我们还可以基于之前的文章中给大家介绍过的pandas的功能拓展库pyjanitor中的「条件连接方法」,直接基于范围比较进行连接,且该方式还支持numba加速运算:

相关文章:

  • LVS NAT模式实现三台RS的轮询访问
  • 计算机二级web易错点(7)-选择题
  • CityEngine:3D城市建模专家
  • 【日语学习】助词で的七作用
  • 解决 Element UI 嵌套弹窗的状态管理问题!!!
  • 航天军工与金融行业 UE/UI 设计:跨越领域的体验革新之道
  • OFD转PDF:解决数字化文档兼容性的最佳途径
  • ActiveMQ 面试备战指南
  • 【QT】QTCreator测试程序
  • CSS 中 letter-spacing 不支持百分比
  • UniApp 表单校验两种方式对比:命令式与声明式
  • Perl语言的计算机网络
  • 【后端开发面试题】每日 3 题(二十)
  • 【CSS】CSS 使用全教程
  • 【学习记录】大模型微调之使用 LLaMA-Factory 微调 Qwen系列大模型,可以用自己的数据训练
  • [01-03-03].第15节:面向对象 - 三大特征
  • PL/SQL语言的扩展运算符
  • C/C++中的条件编译指令#if
  • LVS-DR模式配置脚本
  • LeetCode 热题 100----2.移动零
  • 全球前瞻|特朗普19日将与俄乌总统分别通话,英国脱欧后首开英欧峰会
  • 习近平:坚持科学决策民主决策依法决策,高质量完成“十五五”规划编制工作
  • IPO周报|本周2只新股申购,比亚迪、上汽“小伙伴”来了
  • 浙江推动人工智能终端消费:家居机器人纳入以旧换新补贴范围
  • 旅马大熊猫“福娃”“凤仪”平安回国
  • 全国游泳冠军赛:孙杨、潘展乐同进400自决赛,今晚将正面对决