python如何把几个Excel合并

Python将多个Excel文件合并的核心方法包括：使用pandas库读取Excel文件、合并DataFrame、保存为新的Excel文件。本文将详细介绍如何通过Python将多个Excel文件合并为一个文件，并分享一些实战技巧和常见问题的解决方法。

一、安装所需库

在开始之前，我们需要确保安装了必要的Python库。主要用到的是pandas和openpyxl。这两个库可以通过pip安装：

pip install pandas openpyxl

二、加载Excel文件

首先，我们需要将多个Excel文件读取到Python中。pandas提供了非常方便的接口来读取Excel文件。以下是一个简单的示例：

import pandas as pd
读取Excel文件
file1 = pd.read_excel('file1.xlsx')
file2 = pd.read_excel('file2.xlsx')

三、合并DataFrame

接下来，我们需要将读取的多个DataFrame合并成一个。pandas提供了concat函数，可以非常方便地将多个DataFrame进行上下合并：

# 合并DataFrame
merged_df = pd.concat([file1, file2], ignore_index=True)

在这个例子中，ignore_index=True参数确保合并后的DataFrame有连续的索引。

四、保存合并后的Excel文件

最后，我们将合并后的DataFrame保存为一个新的Excel文件：

# 保存为新的Excel文件
merged_df.to_excel('merged_file.xlsx', index=False)

五、处理多个文件

如果需要合并不止两个文件，可以使用循环来处理：

import pandas as pd
import os
获取所有Excel文件的文件名
file_list = [f for f in os.listdir() if f.endswith('.xlsx')]
读取并合并所有文件
all_data = pd.DataFrame()
for file in file_list:
    df = pd.read_excel(file)
    all_data = pd.concat([all_data, df], ignore_index=True)
保存最终的合并文件
all_data.to_excel('merged_file.xlsx', index=False)

六、处理不同Sheet

有时候，一个Excel文件可能包含多个Sheet。我们需要分别读取这些Sheet并合并：

import pandas as pd
读取多个Sheet
file1 = pd.read_excel('file1.xlsx', sheet_name=None)
file2 = pd.read_excel('file2.xlsx', sheet_name=None)
合并所有Sheet
merged_data = {}
for sheet in file1.keys():
    merged_data[sheet] = pd.concat([file1[sheet], file2[sheet]], ignore_index=True)
保存合并后的数据
with pd.ExcelWriter('merged_file.xlsx') as writer:
    for sheet, data in merged_data.items():
        data.to_excel(writer, sheet_name=sheet, index=False)

七、处理不同格式

在实际应用中，可能会遇到不同的Excel文件格式，例如不同的列名、不同的列顺序等。以下是一些常见的处理方法：

1、统一列名

import pandas as pd
def standardize_columns(df):
    df.columns = ['Col1', 'Col2', 'Col3']  # 根据实际情况修改列名
    return df
file1 = pd.read_excel('file1.xlsx')
file2 = pd.read_excel('file2.xlsx')
file1 = standardize_columns(file1)
file2 = standardize_columns(file2)
merged_df = pd.concat([file1, file2], ignore_index=True)
merged_df.to_excel('merged_file.xlsx', index=False)

2、重新排列列顺序

import pandas as pd
def reorder_columns(df):
    return df[['Col1', 'Col2', 'Col3']]  # 根据实际情况修改列顺序
file1 = pd.read_excel('file1.xlsx')
file2 = pd.read_excel('file2.xlsx')
file1 = reorder_columns(file1)
file2 = reorder_columns(file2)
merged_df = pd.concat([file1, file2], ignore_index=True)
merged_df.to_excel('merged_file.xlsx', index=False)

八、处理空值和缺失数据

在合并过程中，可能会遇到空值或缺失数据。我们可以使用pandas提供的fillna方法来处理这些情况：

import pandas as pd
file1 = pd.read_excel('file1.xlsx')
file2 = pd.read_excel('file2.xlsx')
填充空值
file1.fillna(0, inplace=True)  # 将空值填充为0
file2.fillna(0, inplace=True)
merged_df = pd.concat([file1, file2], ignore_index=True)
merged_df.to_excel('merged_file.xlsx', index=False)

九、处理重复数据

在合并多个Excel文件时，可能会出现重复的数据。我们可以使用drop_duplicates方法来去重：

import pandas as pd
file1 = pd.read_excel('file1.xlsx')
file2 = pd.read_excel('file2.xlsx')
merged_df = pd.concat([file1, file2], ignore_index=True)
去重
merged_df.drop_duplicates(inplace=True)
merged_df.to_excel('merged_file.xlsx', index=False)

十、总结

通过使用pandas库，Python可以非常方便地将多个Excel文件合并为一个文件。本文介绍了从安装所需库、加载Excel文件、合并DataFrame、保存合并后的Excel文件，到处理多种复杂情况的详细步骤。希望这些内容能帮助你在实际工作中顺利完成Excel文件的合并任务。

在项目管理中，特别是在处理大量Excel数据时，推荐使用研发项目管理系统PingCode和通用项目管理软件Worktile，这些工具可以帮助你更高效地管理项目和数据。

通过这些方法和工具，你将能够更好地处理和管理Excel文件，提高工作效率。

python如何把几个Excel合并

一、安装所需库

二、加载Excel文件

读取Excel文件

三、合并DataFrame

四、保存合并后的Excel文件

五、处理多个文件

获取所有Excel文件的文件名

读取并合并所有文件

保存最终的合并文件

六、处理不同Sheet

读取多个Sheet

合并所有Sheet

保存合并后的数据