当前位置：首页 > news >正文

纵向合并和横向合并工作表的思路

news 2025/10/15 8:37:39

文章目录

纵向合并
- 一、方案1：手动复制粘贴（最基础无门槛）
- - 核心原理
  - 操作步骤
  - 适用场景
  - 优缺点
- 二、方案2：移动或复制工作表（整表合并专用）
- - 核心原理
  - 操作步骤
  - - 场景1：同一工作簿内合并（将多个工作表整合到同一文件）
    - 场景2：跨工作簿合并（将A文件的表复制到B文件）
  - 适用场景
  - 优缺点
- 三、方案3：Power Query（Excel/Power BI的“数据合并神器”）
- - 核心原理
  - 操作步骤（以Excel 2021为例，合并同一工作簿内的多个工作表）
  - 适用场景
  - 优缺点
- 四、方案4：pandas批量处理（Python代码级高效合并）
- - 核心原理
- 方案五函数法（INDIRECT+ROW 组合，适合固定结构）
- 方案六函数法（INDIRECT+ROW 组合+SEQUENCE，适合数量稍微多一点的情况）
横向合并
- 方案一 .手动复制粘贴
- 方案二.Power Query（Excel/Power BI的“数据合并神器”）
- 方案三：Excel公式处理（按条件动态合并）
- - 核心原理
  - 操作步骤（以「VLOOKUP合并两表」为例）
  - - 场景：将“销售表”和“业绩表”按“姓名”合并，补充“业绩排名”
  - 其他常用公式场景
  - 适用场景
- 方案四 pandas批量处理（Python代码级高效合并）

纵向合并

一、方案1：手动复制粘贴（最基础无门槛）

核心原理

直接通过Excel的「复制（Ctrl+C）」「粘贴（Ctrl+V）」功能，将源工作表的目标数据逐份转移到统一的“汇总表”中，本质是人工手动完成数据迁移。

操作步骤

准备汇总表：新建一个Excel文件（或在现有文件中插入新工作表），命名为「汇总表」，并手动录入统一的表头（如“姓名、日期、销售额”）。
复制源数据：打开需要合并的源工作表（如“1月销售”“2月销售”），选中除表头外的所有数据区域（可按「Ctrl+A」全选，再手动剔除表头）。
粘贴到汇总表：切换到「汇总表」，点击表头下方的第一个空白单元格（如A2），右键选择「粘贴」（或按Ctrl+V）；若需保留格式，可选择「粘贴选项→保留源格式」。
重复操作：对所有需要合并的工作表，重复步骤2-3，确保数据依次追加到汇总表中（避免覆盖已有数据）。

适用场景

仅需合并2-3个工作表，且每个表的数据量极少（如≤100行）。
临时合并需求，后续不再重复操作（无需学习工具）。
对Excel功能不熟悉，仅掌握基础操作的用户。

优缺点

优点	缺点
无学习成本，上手即会	效率极低，数据量多时耗时耗力
无需依赖任何工具/代码	易出错（如漏粘、多粘、格式错乱）
可灵活选择部分数据合并（无需全表）	无法自动化，重复操作时无复用性

二、方案2：移动或复制工作表（整表合并专用）

核心原理

利用Excel自带的「移动或复制工作表」功能，将多个独立的工作表（或跨工作簿的工作表）直接“复制”到同一个工作簿中，实现整表级别的合并（而非数据内容的拼接）。

操作步骤

场景1：同一工作簿内合并（将多个工作表整合到同一文件）

打开包含多个工作表的Excel文件（如“销售数据.xlsx”，内有“1月”“2月”“3月”3个表）。
右键点击需要合并的工作表标签（如“2月”），选择「移动或复制(M)…」。
在弹出的对话框中：
- 「下列选定工作表之前」：选择要插入的位置（如“1月”之前，或“移至最后”）。
- 勾选「建立副本©」（关键！避免原工作表被移动走）。
点击「确定」，重复步骤2-3，将“3月”等其他工作表复制到同一工作簿中，最终所有表都在一个文件内。

场景2：跨工作簿合并（将A文件的表复制到B文件）

同时打开源工作簿（如“1月销售.xlsx”）和目标工作簿（如“汇总销售.xlsx”）。
在源工作簿中右键点击工作表标签（如“1月”），选择「移动或复制(M)…」。
在「工作簿(W)」下拉框中，选择目标工作簿（如“汇总销售.xlsx”）。
勾选「建立副本©」，选择插入位置，点击「确定」，完成跨文件整表复制。

适用场景

需合并完整的工作表（而非筛选部分数据），且各工作表的结构（表头、格式）完全一致。
需保留原工作表的所有内容（包括公式、图表、格式），不做数据清洗。
跨工作簿整合工作表，且无需拼接数据内容（仅需将表集中到一个文件）。

优缺点

优点	缺点
操作速度快，1-2步完成整表合并	仅能合并“整个工作表”，无法筛选部分数据
完美保留原表格式、公式、图表	无法拼接数据（如将1月、2月数据合并到同一列）
支持跨工作簿操作，无需复制粘贴内容	若各工作表结构不同（表头不一致），合并后无意义

三、方案3：Power Query（Excel/Power BI的“数据合并神器”）

核心原理

Power Query是Excel（2016+）和Power BI内置的数据处理引擎，可通过“可视化界面”实现“批量读取多个工作表→数据清洗（统一格式、补全缺失值）→合并/追加数据→加载到汇总表”的全流程自动化，支持重复执行（数据更新后只需刷新）。

操作步骤（以Excel 2021为例，合并同一工作簿内的多个工作表）

新建Power Query查询：
- 打开需要合并的Excel文件，点击「数据」选项卡→「获取数据」→「来自文件」→「来自工作簿」。
- 选择当前工作簿（或其他源文件），点击「导入」。
选择要合并的工作表：
- 在弹出的「导航器」窗口中，按住「Ctrl」键，勾选所有需要合并的工作表（如“1月”“2月”“3月”）。
- 勾选左下角「选择多项(M)」，点击「编辑」（进入Power Query编辑器）。
追加所有工作表数据：
- 在Power Query编辑器中，点击「开始」选项卡→「追加查询」→「将查询追加到另一个查询」。
- 选择「三个或更多表」，将所有勾选的工作表添加到「要追加的表」列表中，点击「确定」。
数据清洗（可选但重要）：
- 若各表表头不一致：点击「转换」→「将第一行用作标题」，统一表头。
- 若有缺失值/错误值：右键点击列标题→「替换值」或「删除空行」。
加载到汇总表：
- 点击「开始」→「关闭并上载」，选择将数据加载到“新工作表”（即汇总表）。
- 后续源数据更新时，只需右键汇总表→「刷新」，即可自动更新合并结果。

适用场景

需合并大量工作表（如10+个），且各表结构相似（表头略有差异可通过清洗统一）。
需对数据进行预处理（如删除空行、统一格式、筛选有效数据）后再合并。
数据需定期更新（如每月新增工作表，刷新即可合并，无需重复操作）。
同时适用于Excel和Power BI，跨工具兼容。

优缺点

优点	缺点
自动化程度高，一次配置可重复刷新	入门有门槛，需学习基础操作（如追加查询、数据清洗）
支持复杂数据处理（筛选、去重、格式统一）	Excel 2013及更早版本需单独安装（2016+内置）
无代码操作，可视化界面易上手	处理超大规模数据（100万+行）时可能卡顿
合并结果与源数据联动，更新方便	不支持直接保留原表的图表/格式（仅保留数据）

四、方案4：pandas批量处理（Python代码级高效合并）

核心原理

concat() 是 pandas 中纵向合并的核心函数，可将多个 DataFrame 按行拼接（要求列名一致）。

import pandas as pd
import openpyxl# 读取工作簿
工作簿路径 = "数据.xlsx"
工作表列表 = ["Sheet1", "Sheet2", "Sheet3"]  # 需要合并的工作表名# 循环读取每个工作表，存入列表
df_list = []
for 表名 in 工作表列表:df = pd.read_excel(工作簿路径, sheet_name=表名)df_list.append(df)# 纵向合并所有DataFrame
合并结果 = pd.concat(df_list, ignore_index=True)  # ignore_index=True重置索引# 保存结果
合并结果.to_excel("纵向合并结果.xlsx", index=False)

方案五函数法（INDIRECT+ROW 组合，适合固定结构）

步骤1：创建汇总表
在Excel中新建一个工作表，命名为“汇总表”。
将Sheet1的标题行复制到汇总表的第一行（例如A1、B1等）。这确保汇总表有相同的列结构。
步骤2：使用公式合并数据
我们将使用Excel的IF、INDEX和COUNTA函数来动态引用数据。公式会根据行号自动从Sheet1、Sheet2或Sheet3中提取数据。
关键思路：
用COUNTA(Sheet1!A:A)-1计算Sheet1的数据行数（减去标题行）。
用类似方法计算Sheet2和Sheet3的数据行数。
使用IF函数判断当前行应该引用哪个工作表的数据：先引用Sheet1的数据，完成后引用Sheet2，最后引用Sheet3。
使用INDEX函数动态获取具体单元格的值。

=IF(ROW(A1)<=COUNTA(Sheet1!A:A)-1, INDEX(Sheet1!A:A, ROW(A1)+1),IF(ROW(A1)<=COUNTA(Sheet1!A:A)-1+COUNTA(Sheet2!A:A)-1, INDEX(Sheet2!A:A, ROW(A1)-COUNTA(Sheet1!A:A)+2),IF(ROW(A1)<=COUNTA(Sheet1!A:A)-1+COUNTA(Sheet2!A:A)-1+COUNTA(Sheet3!A:A)-1, INDEX(Sheet3!A:A, ROW(A1)-COUNTA(Sheet1!A:A)-COUNTA(Sheet2!A:A)+3), "")))

公式的解释
ROW(A1)：返回当前行号（在A2中，ROW(A1)=1，向下拖动时变为2、3…）。
COUNTA(Sheet1!A:A)-1：计算Sheet1的数据行数（减去标题行）。
第一个IF：如果当前行号小于等于Sheet1的数据行数，则从Sheet1的A列取数据（INDEX(Sheet1!A:A, ROW(A1)+1)，因为数据从第2行开始）。
第二个IF：如果当前行号超过Sheet1但小于等于Sheet1+Sheet2的数据行数，则从Sheet2的A列取数据（调整行号偏移）。
第三个IF：类似处理Sheet3的数据。
最后返回空字符串""表示无更多数据。

方案六函数法（INDIRECT+ROW 组合+SEQUENCE，适合数量稍微多一点的情况）

原理：动态数组公式会自动计算所有结果，并 “溢出” 到下方的单元格，无论数据有多少行。

把原来的ROW(A1)改成SEQUENCE(总数据行数)，直接生成从 1 开始的序列，公式会自动扩展。
假设总数据行数是三个表的有效数据总和（即COUNTA(Sheet1!A:A)-1 + COUNTA(Sheet2!A:A)-1 + COUNTA(Sheet3!A:A)-1），可以这样写

=LET(total1, MAX(1, COUNTA(Sheet1!A2:A1000)),  total2, MAX(1, COUNTA(Sheet2!A2:A1000)), total3, MAX(1, COUNTA(Sheet3!A2:A1000)),total, total1+total2+total3,rowNum, SEQUENCE(total),IF(rowNum<=total1,INDEX(Sheet1!A2:A1000, rowNum),IF(rowNum<=total1+total2,INDEX(Sheet2!A2:A1000, rowNum-total1),INDEX(Sheet3!A2:A1000, rowNum-total1-total2)))
)

用法：在目标单元格（比如 A1）输入这个公式，回车后会自动填充所有行，直到三个表的数据取完，无需手动下拉。（LET函数是为了简化公式，避免重复计算，旧版本 Excel 可能不支持，但动态数组的核心是SEQUENCE）

横向合并

方案一 .手动复制粘贴

操作步骤：

以标识列（如 “用户 ID”）为基准，在目标表中复制第一个表的所有列，然后在其他表中按标识列手动查找匹配项，复制对应列的数据到目标表。
适用场景：仅 2 个表，且标识列无重复、数据量极小（几十行）。
优缺点：简单但极易出错（匹配错误），效率极低，几乎不实用。

方案二.Power Query（Excel/Power BI的“数据合并神器”）

步骤 1：进入 Power Query 编辑器
在 Excel 中，选中任一表格，点击 “数据”→“来自表格 / 区域”（若已加载则点击 “编辑查询”），打开 Power Query 编辑器。
步骤 2：选择主表并发起合并
在 Power Query 编辑器的 “查询” 面板（左侧）中，选中你想作为 “主表” 的查询（即保留所有行的表格）。
点击顶部菜单栏的 “开始”→“合并查询”（或 “合并查询作为新查询”，前者会在主表中直接合并，后者生成新查询）。
步骤 3：设置合并参数
在弹出的 “合并” 窗口中，按以下步骤配置：
选择要合并的第二个表格：在 “第二个表格” 下拉框中，选择需要合并的另一个表格（副表）。
选择键列（匹配列）：
在主表的列列表中，点击用于匹配的键列（如 “客户 ID”）。
在副表的列列表中，点击对应的键列（需与主表键列含义一致，如同样选择 “客户 ID”）。
若需多列匹配，按住Ctrl键分别选择多列（主表和副表需对应选择）。
选择合并类型（连接方式）：在 “连接类型” 下拉框中选择（根据需求选择，类似 SQL 的 JOIN）：
内连接：仅保留主表和副表中键列完全匹配的行。
左外连接：保留主表所有行，仅匹配副表中对应的行（不匹配的副表列显示 “null”）。
右外连接：保留副表所有行，仅匹配主表中对应的行（不匹配的主表列显示 “null”）。
全外连接：保留两个表格的所有行，无论是否匹配（不匹配的列显示 “null”）。
配置完成后点击 “确定”。
步骤 4：展开合并后的列
合并后，主表中会新增一列（默认名为 “表” 或副表名称），该列的值是嵌套的表格（包含副表中匹配的行）。需展开该列以显示具体字段：
点击新增列右侧的 “展开” 按钮（两个箭头的图标）。
在弹出的窗口中，取消勾选 “使用原始列名作为前缀”（可选，避免列名重复），然后勾选需要保留的副表字段。
点击 “确定”，此时副表的字段会横向添加到主表中。
步骤 5：完成并加载
合并和展开后，可按需删除不需要的列（选中列→右键→删除）。
点击 Power Query 编辑器顶部的 “关闭并上载”，将合并后的表格加载到 Excel 中。

方案三：Excel公式处理（按条件动态合并）

核心原理

利用Excel的函数（如VLOOKUP、INDEX+MATCH、TEXTJOIN），按特定条件将多个工作表的关联数据合并到汇总表中（而非直接追加数据），适合“按关键字匹配合并”（如按“姓名”关联多表信息）。

操作步骤（以「VLOOKUP合并两表」为例）

场景：将“销售表”和“业绩表”按“姓名”合并，补充“业绩排名”

准备两张表：
- 表1（销售表）：包含“姓名、销售额”两列（A1:B5）。
- 表2（业绩表）：包含“姓名、业绩排名”两列（A1:C5，存放在“业绩表”工作表中）。
- 汇总表：需包含“姓名、销售额、业绩排名”三列（A1:C1为表头）。
用VLOOKUP公式匹配数据：
- 在汇总表的C2单元格（业绩排名列）输入公式：
  =VLOOKUP(A2, 业绩表!$A$2:$C$5, 3, 0)
  公式解释：
  - A2：汇总表中用于匹配的关键字（姓名）。
  - 业绩表!$A$2:$C$5：查找范围（业绩表的姓名列到排名列，锁定绝对引用）。
  - 3：返回查找范围中第3列的数据（业绩排名）。
  - 0：精确匹配（必须找到完全一致的姓名才返回结果）。
批量填充公式：
- 选中C2单元格，双击右下角的“填充柄”（小方块），公式自动填充到C3:C5，完成按“姓名”合并。

其他常用公式场景

TEXTJOIN合并文本：将多列文本合并为一列（如=TEXTJOIN("-", TRUE, A2, B2, C2)，用“-”连接A2、B2、C2的内容）。
INDEX+MATCH合并（比VLOOKUP灵活）：支持反向查找（从右向左找），公式：=INDEX(业绩表!$C$2:$C$5, MATCH(A2, 业绩表!$A$2:$A$5, 0))。

适用场景

需按关键字关联合并（如按“ID”“姓名”匹配多表数据），而非单纯追加数据。
数据量较少（≤1000行），且需动态更新（源数据变化时，公式结果自动更新）。
无需全表合并，仅需提取部分关联字段（如从“明细表”提取“汇总字段”）。

方案四 pandas批量处理（Python代码级高效合并）

import pandas as pd
import osdef merge_multiple_sheets(file_path, key_column, sheets_to_merge=None, merge_type='outer'):"""合并 Excel 文件中的多个工作表参数:file_path: Excel 文件路径key_column: 合并的键列名sheets_to_merge: 要合并的工作表列表，None 表示合并所有merge_type: 合并类型 ('inner', 'outer', 'left', 'right')"""# 读取所有工作表或指定工作表if sheets_to_merge is None:all_sheets = pd.read_excel(file_path, sheet_name=None)else:all_sheets = {}for sheet in sheets_to_merge:all_sheets[sheet] = pd.read_excel(file_path, sheet_name=sheet)# 合并工作表merged_df = Nonesheet_count = 0for sheet_name, df in all_sheets.items():sheet_count += 1if merged_df is None:merged_df = dfprint(f"基础工作表: {sheet_name}")else:merged_df = pd.merge(merged_df, df, on=key_column, how=merge_type,suffixes=('', f'_{sheet_name}'))print(f"合并工作表: {sheet_name}")print(f"成功合并 {sheet_count} 个工作表")return merged_df# 使用示例
file_path = 'your_data.xlsx'# 方法A: 合并所有工作表
result1 = merge_multiple_sheets(file_path, key_column='ID')# 方法B: 合并指定工作表
sheets_list = ['Jan', 'Feb', 'Mar', 'Apr']
result2 = merge_multiple_sheets(file_path, key_column='ProductID', sheets_to_merge=sheets_list)# 保存结果
result1.to_excel('merged_all_sheets.xlsx', index=False)
result2.to_excel('merged_selected_sheets.xlsx', index=False)

函数的核心逻辑分为两个主要阶段：读取工作表和逐一合并。

读取工作表阶段：

如果sheets_to_merge为None，则使用pd.read_excel(file_path, sheet_name=None)读取整个Excel文件的所有工作表，返回一个字典，其中键为工作表名称，值为对应的DataFrame。这是一种高效的全文件加载方式，适合未知工作表数量的场景。
如果指定了sheets_to_merge列表，则循环读取每个指定工作表，形成相同的字典结构。这种选择性读取有助于优化内存使用，尤其在处理大型Excel文件时，避免加载无关数据。
注意：pd.read_excel 默认使用自动引擎（如openpyxl for .xlsx格式），假设文件存在且可读。若文件路径错误或格式不支持，函数未添加显式错误处理，因此实际应用中建议在调用前检查文件，或在函数内添加try-except块捕获异常如FileNotFoundError或ValueError。

合并阶段：

初始化merged_df为None，并设置计数器sheet_count跟踪处理的工作表数量。
遍历字典中的每个工作表：
– 第一个工作表作为基础：merged_df = df，并打印“基础工作表: {sheet_name}”以提供进度反馈。
– 后续工作表使用pd.merge函数合并：参数包括on=key_column指定键列、how=merge_type定义合并类型（默认为’outer’，即保留所有行，缺失值用NaN填充）、suffixes=(‘’, f’_{sheet_name}‘)自动为重叠列添加后缀（如第二个表的’Sales’列变为’Sales_Sheet2’），避免列名冲突。

每次合并后打印“合并工作表: {sheet_name}”，便于调试。
循环结束后，打印“成功合并 {sheet_count} 个工作表”，返回最终的merged_df。
这种顺序合并（sequential merge）从第一个表开始逐步加入，类似于左连接的链式操作。对于多个表，这可能导致后缀累积，但逻辑简单易追踪。相比使用functools.reduce的简洁方式，这种显式循环更利于添加自定义逻辑，如数据清洗。

查看全文

http://www.dtcms.com/a/482524.html