Python如何批量操作excel

Python通过pandas库实现对Excel文件的批量操作是高效、灵活的。使用pandas库，可进行读取、写入和修改Excel文件、批量处理数据以及与Excel函数集成。具体而言，可以使用pandas的read_excel函数快速读取Excel数据到DataFrame，通过to_excel函数将DataFrame导出为Excel文件。进一步，pandas配合openpyxl或xlrd等库，可以对Excel的高级特性进行操作，如设置样式、筛选或应用公式等。

首先，我们需要导入Python中处理Excel文件的pandas库和Excel文件读写库。使用pandas进行数据读取时，可以指定读取特定的工作表、列、行等；而写入到Excel时，可以对数据进行批量的修改、汇总并通过ExcelWriter类高效地写入多个DataFrame到多个工作表。另外，为了更精细地控制Excel的各种格式，往往需要与openpyxl或xlwt等库结合使用，这些库可以让我们设置单元格样式、字体、颜色、公式等。

接下来，将详细介绍Python批量操作Excel的具体步骤和代码实现方式。

一、安装与准备工作

在批量操作Excel之前，需要确保系统中安装了pandas及其依赖的Excel库openpyxl或xlrd（Python3及以上版本推荐使用openpyxl）。

# 安装pandas和openpyxl pip install pandas openpyxl

二、读取Excel文件

pandas的read_excel函数可以快速将Excel文件读入为DataFrame。

import pandas as pd
读取Excel文件
df = pd.read_excel('path_to_excel.xlsx', sheet_name='Sheet1')

可以指定读取特定的工作表、列、行：

# 读取特定的工作表、列和行
df = pd.read_excel('path_to_excel.xlsx', sheet_name='Sheet1', usecols=['A', 'B', 'C'], skiprows=range(1, 5))

三、写入Excel文件

将DataFrame数据写回Excel，可以使用to_excel函数以及ExcelWriter类进行批量操作。

# 将DataFrame写入Excel
df.to_excel('path_to_new_excel.xlsx', sheet_name='NewSheet')

当需要对多个DataFrame执行写入操作时，可以使用ExcelWriter：

with pd.ExcelWriter('path_to_excel.xlsx') as writer:
    df1.to_excel(writer, sheet_name='Sheet1')
    df2.to_excel(writer, sheet_name='Sheet2')

四、Excel数据处理

通过pandas的DataFrame，可以进行复杂的数据处理：

# 数据过滤
filtered_df = df[df['Column'] > 10]
数据聚合
summary = df.groupby('GroupColumn').agg({'NumericColumn': 'sum'})

五、格式和样式设置

pandas与openpyxl配合使用可以设置单元格的格式和样式：

from openpyxl import load_workbook
创建Excel写入器
book = load_workbook('path_to_excel.xlsx')
writer = pd.ExcelWriter('path_to_excel.xlsx', engine='openpyxl')
writer.book = book
带有格式的写入
df.to_excel(writer, sheet_name='StyledSheet')
sheet = writer.sheets['StyledSheet']
设置单元格格式
for cell in sheet['A'] + sheet[1]:
    cell.style = 'Pandas'
writer.save()

六、使用公式

使用openpyxl的write-only模式可以高效地写入包含公式的大型数据：

from openpyxl import Workbook
wb = Workbook(write_only=True)
ws = wb.create_sheet()
写入公式
ws.append(['=SUM(1, 1)', '=AVERAGE(1, 2, 3)', '=VLOOKUP(A1, sheet2!A:B, 2, FALSE)'])
wb.save('path_to_excel_with_formulas.xlsx')

七、批量读写操作

对于要处理多个文件的批量操作，可以结合文件操作和pandas的读写能力：

import os
批量读取文件
excel_files = [f for f in os.listdir('.') if f.endswith('.xlsx')]
批量写入
for file in excel_files:
    df = pd.read_excel(file)
    # 执行数据处理...
    df.to_excel('processed_' + file)

通过上述步骤和示例代码，Python能够高效完成对Excel文件的批量操作，包括读写数据、数据处理、格式设置，甚至是复杂的逻辑与公式应用，极大地扩展了Excel的使用场景和功能性。