如何用python遍历excel文件

使用Python遍历Excel文件的常见方法有：pandas库、openpyxl库、xlrd库、xlwings库。其中最常用和功能强大的是pandas库，因为它不仅能够方便地读取和写入Excel文件，还能进行数据分析和处理。下面详细介绍如何使用pandas库来遍历Excel文件。

一、使用pandas库遍历Excel文件

pandas是一个强大的数据处理和分析库，它提供了高效的数据结构和数据分析工具。使用pandas库遍历Excel文件非常简单，只需要几行代码。

首先，你需要安装pandas库。如果你还没有安装，可以使用pip命令进行安装：

pip install pandas

读取Excel文件

使用pandas的read_excel函数可以读取Excel文件。你可以读取整个Excel文件，也可以只读取其中的一个工作表。下面是一个简单的例子：

import pandas as pd
读取整个Excel文件
df = pd.read_excel('example.xlsx')
读取指定的工作表
df_sheet = pd.read_excel('example.xlsx', sheet_name='Sheet1')

遍历Excel文件

读取Excel文件后，你可以使用pandas提供的各种方法来遍历数据。例如，你可以使用iterrows方法遍历每一行数据：

# 遍历每一行数据
for index, row in df.iterrows():
    print(f"Index: {index}, Row: {row}")

你还可以使用itertuples方法遍历每一行数据，这种方法比iterrows方法更快：

# 遍历每一行数据
for row in df.itertuples(index=True, name='Pandas'):
    print(row)

二、使用openpyxl库遍历Excel文件

openpyxl是一个专门处理Excel文件的库，支持Excel 2010及以上版本。使用openpyxl库可以更灵活地操作Excel文件，但相对于pandas库来说，它的操作会稍微复杂一些。

首先，你需要安装openpyxl库：

pip install openpyxl

读取Excel文件

使用openpyxl的load_workbook函数可以读取Excel文件。你可以读取整个Excel文件，也可以只读取其中的一个工作表。下面是一个简单的例子：

from openpyxl import load_workbook
读取Excel文件
wb = load_workbook('example.xlsx')
获取所有工作表的名称
sheet_names = wb.sheetnames
print(sheet_names)
读取指定的工作表
ws = wb['Sheet1']

遍历Excel文件

读取Excel文件后，你可以使用openpyxl提供的方法来遍历数据。例如，你可以使用iter_rows方法遍历每一行数据：

# 遍历每一行数据
for row in ws.iter_rows(values_only=True):
    print(row)

你还可以使用iter_cols方法遍历每一列数据：

# 遍历每一列数据
for col in ws.iter_cols(values_only=True):
    print(col)

三、使用xlrd库遍历Excel文件

xlrd是一个专门用于读取Excel文件的库，支持Excel 97-2003格式。由于xlrd库不支持写入操作，因此你只能用它来读取Excel文件。

首先，你需要安装xlrd库：

pip install xlrd

读取Excel文件

使用xlrd的open_workbook函数可以读取Excel文件。你可以读取整个Excel文件，也可以只读取其中的一个工作表。下面是一个简单的例子：

import xlrd
读取Excel文件
wb = xlrd.open_workbook('example.xls')
获取所有工作表的名称
sheet_names = wb.sheet_names()
print(sheet_names)
读取指定的工作表
ws = wb.sheet_by_name('Sheet1')

遍历Excel文件

读取Excel文件后，你可以使用xlrd提供的方法来遍历数据。例如，你可以使用row_values方法遍历每一行数据：

# 遍历每一行数据
for row_idx in range(ws.nrows):
    row = ws.row_values(row_idx)
    print(row)

你还可以使用col_values方法遍历每一列数据：

# 遍历每一列数据
for col_idx in range(ws.ncols):
    col = ws.col_values(col_idx)
    print(col)

四、使用xlwings库遍历Excel文件

xlwings是一个功能强大的Excel自动化库，支持与Excel进行交互。使用xlwings库可以更加灵活地操作Excel文件，但相对于pandas库来说，它的操作会稍微复杂一些。

首先，你需要安装xlwings库：

pip install xlwings

读取Excel文件

使用xlwings的Book类可以读取Excel文件。你可以读取整个Excel文件，也可以只读取其中的一个工作表。下面是一个简单的例子：

import xlwings as xw
读取Excel文件
wb = xw.Book('example.xlsx')
获取所有工作表的名称
sheet_names = [sheet.name for sheet in wb.sheets]
print(sheet_names)
读取指定的工作表
ws = wb.sheets['Sheet1']

遍历Excel文件

读取Excel文件后，你可以使用xlwings提供的方法来遍历数据。例如，你可以使用range方法遍历每一行数据：

# 遍历每一行数据
for row in ws.range('A1').expand('table').value:
    print(row)

你还可以使用range方法遍历每一列数据：

# 遍历每一列数据
for col in ws.range('A1').expand('table').options(transpose=True).value:
    print(col)

五、总结

通过以上介绍，我们可以看到，使用Python遍历Excel文件的方法有很多，其中最常用和功能强大的是pandas库，因为它不仅能够方便地读取和写入Excel文件，还能进行数据分析和处理。openpyxl库适用于需要更灵活地操作Excel文件的场景，而xlrd库则适用于读取Excel 97-2003格式的文件。xlwings库则适用于需要与Excel进行交互的场景。根据具体需求选择合适的库，可以更高效地完成Excel文件的遍历和操作。