Power Query合并数据
一、表结构数据的数据结构
跟数据库数据结构一样。
- 层级关系:数据库的构成自内向外分为字段、数据表和数据库三个层级。字段的集合构成数据表,数据表的集合构成数据库。
- 字段组成:
- 标题行:字段的第一行信息,用于标识字段,称为字段名(如"姓名"、"年龄"、"性别")
- 记录:从第二行开始到最后一行,记载字段内的具体数据内容
- 示例说明:销售业务数据库包含员工属性表(有姓名、年龄、性别等字段)、产品属性表、销售业绩表等多个数据表
二、横向合并数据
1、基本概念
- 定义:将副表中主表没有的字段信息合并到主表,类似于Excel的VLOOKUP函数
- 表角色:
- 主表:存放最终合并结果的表
- 副表:为主表提供补充信息的表
- 关键字段要求:
- 主副表都必须包含该字段
- 字段值能相互对应(字段名可以不同)
- 理想情况应无重复值且能一一对应
2、注意事项
- 非一一对应情况:当关键字段值不是一一对应时,不同联接种类会产生不同结果
- 重复值影响:关键字段有重复值时,合并后总行数为各表重复出现次数的乘积(如主表重复2次×副表重复2次=4行结果)
- 连接种类:
- 内部连接:仅保留两表都匹配的行
- 左外部连接:保留左表所有行和右表匹配行(老版本Power Query默认)
3、演示合并方法
操作步骤:
- 新建Excel文件,在"数据"选项卡下选择"新建查询"
- 从工作簿导入包含"商机记录"和"商机相关企业信息"两个工作表的数据
- 将两个表都加载为Power Query中的表
- 在Power Query编辑器中选择主表(商机记录)
- 在"开始"选项卡下点击"合并查询"
- 选择副表(商机相关企业信息)
- 分别选择两表中的客户ID作为关键字段
- 选择连接种类(演示中使用内部连接)
这里和MySQL的join查询一样,不再赘述。
这里显示是Table类型
字段展开:
- 点击新生成字段的展开箭头
- 选择"扩展"并勾选需要的字段
- 可取消"使用原始列名作为前缀"避免字段名过长
结果特点:
内部连接只保留8行两表都匹配的记录(原主表26行,副表24行)
展开了😄
也可以自己选
则只显示所需字段
点击"关闭并上载"生成最终合并表
结果验证:新表包含主表原有字段和从副表合并来的客户名称、城市、企业规模等补充信息
三、纵向合并数据
待补充。。。