当前位置: 首页 > news >正文

使用pandas实现合并具有共同列的两个EXCEL表

表1:

表2:

表1和表2,有共同的列“名称”,而且,表1的内容(行数)<=表2的行数。

目的,根据“名称”列的对应内容,将表2列中的“所处行业”填写到表1相应的位置。

实现代码:

import pandas as pdcsv_file_path_a = '表1.csv'  # 替换为你的CSV文件路径
csv_file_path_b = '表2.csv'  # 替换为你的CSV文件路径
df_a = pd.read_csv(csv_file_path_a, encoding='gbk')
df_b = pd.read_csv(csv_file_path_b, encoding='gbk')df_merged = pd.merge(df_a, df_b[['名称', '所处行业']], on='名称', how='left')
df_merged.to_csv('合并结果.csv', index=False, encoding='gbk')

结果(生成一个新的叫做“合并结果.csv”),如下图:

关键代码解释:

on='名称':以“名称”列为匹配键。how='left':保留第一个表(df1)中的所有行,只添加匹配上的“所处行业”。df2[['名称', '所处行业']]:只取 df2 中需要的列,避免多余列混入。

 

相关文章:

  • Perl One-liner 数据处理——基础语法篇【匠心】
  • 汽车安全体系:FuSa、SOTIF、Cybersecurity 从理论到实战
  • JAVA中的注解和泛型
  • docker-部署Nginx以及Tomcat
  • 6.linux文本内容显示cat,more,less
  • 如何自动部署GitLab项目
  • 【Elasticsearch】Elasticsearch 核心技术(一):索引
  • 《 C++ 点滴漫谈: 四十 》文本的艺术:C++ 正则表达式的高效应用之道
  • 【机器学习基础】机器学习入门核心:数学基础与Python科学计算库
  • deep forest安装及使用教程
  • 各地数字化转型服务商要求的核心特性解析
  • 调用蓝耘API打造AI 智能客服系统实践教程
  • css使用scoped之后样式失效问题
  • 自定义Shell命令行解释器
  • SCAU8643--简单选择排序
  • 微软PowerBI考试 PL-300学习指南
  • 内存管理--《Hello C++ Wrold!》(8)--(C/C++)--深入剖析new和delete的使用和底层实现
  • Linux--进程概念
  • 源码解析(三):Stable Diffusion
  • 嵌入式学习笔记 - freeRTOS 动态创建任务跟静态创建任务的区别,以及内存回收问题
  • 可信网站行业验证必须做吗/无锡网站优化公司
  • 南岸网站建设/营销管理
  • 市住房和城乡建设局网站大连/北京seo网络推广
  • 网站建设培训美女/网页搜索优化seo
  • 网站建设运营部部长岗位职责/2345网址导航下载
  • 做推文的编辑网站/刷推广链接的网站