python如何从excel获取数据

Python从Excel获取数据的方法有很多，其中最常用的有pandas库、openpyxl库、xlrd库等。Pandas库是最常用的，因为它功能强大且易于使用，它能够轻松地读取Excel文件并将其转换为DataFrame数据结构进行操作。下面将详细描述如何使用Pandas库从Excel中获取数据，并介绍其他几种方法。

一、使用Pandas库读取Excel文件

Pandas库是Python数据分析的利器，它提供了丰富的数据处理功能。使用Pandas读取Excel文件非常简单，只需要几行代码。

1.1 安装Pandas库

首先，确保已经安装了Pandas库。可以使用以下命令进行安装：

pip install pandas

1.2 读取Excel文件

使用pandas.read_excel函数可以读取Excel文件。以下是一个示例：

import pandas as pd
读取Excel文件
df = pd.read_excel('example.xlsx')
显示前五行数据
print(df.head())

在上面的代码中，pd.read_excel函数将Excel文件读取为DataFrame对象。然后，我们使用head方法查看前五行数据。

1.3 读取特定的工作表

如果Excel文件中有多个工作表，可以指定要读取的工作表名称或索引：

# 读取特定的工作表
df = pd.read_excel('example.xlsx', sheet_name='Sheet1')

1.4 读取特定的列

如果只需要读取特定的列，可以使用usecols参数：

# 读取特定的列
df = pd.read_excel('example.xlsx', usecols=['Column1', 'Column2'])

1.5 读取特定的行

可以使用skiprows和nrows参数来读取特定的行：

# 读取特定的行
df = pd.read_excel('example.xlsx', skiprows=2, nrows=10)

1.6 处理缺失值

Pandas可以自动处理缺失值，将其转换为NaN。可以使用fillna和dropna方法进行处理：

# 填充缺失值
df.fillna(0, inplace=True)
删除包含缺失值的行
df.dropna(inplace=True)

二、使用Openpyxl库读取Excel文件

Openpyxl库是一个专门用于处理Excel文件的库，适用于Excel 2007及以后的版本。它比Pandas更底层，可以进行更多的Excel文件操作。

2.1 安装Openpyxl库

首先，确保已经安装了Openpyxl库。可以使用以下命令进行安装：

pip install openpyxl

2.2 读取Excel文件

使用Openpyxl库可以读取Excel文件，并获取工作表中的数据。以下是一个示例：

import openpyxl
打开Excel文件
wb = openpyxl.load_workbook('example.xlsx')
获取特定的工作表
sheet = wb['Sheet1']
读取工作表中的数据
data = []
for row in sheet.iter_rows(values_only=True):
    data.append(row)
显示数据
for row in data:
    print(row)

在上面的代码中，我们使用openpyxl.load_workbook函数打开Excel文件，并使用工作表名称获取特定的工作表。然后，使用iter_rows方法遍历工作表中的所有行，并将数据存储在列表中。

2.3 读取特定的单元格

可以使用行列索引读取特定的单元格数据：

# 读取特定的单元格
cell_value = sheet.cell(row=1, column=1).value
print(cell_value)

2.4 读取特定范围的数据

可以使用切片读取特定范围的数据：

# 读取特定范围的数据
for row in sheet['A1:C3']:
    for cell in row:
        print(cell.value)

三、使用xlrd库读取Excel文件

xlrd库是一个用于读取Excel文件的库，适用于Excel 97-2003格式（.xls）和Excel 2007及以后的格式（.xlsx）。

3.1 安装xlrd库

首先，确保已经安装了xlrd库。可以使用以下命令进行安装：

pip install xlrd

3.2 读取Excel文件

使用xlrd库可以读取Excel文件，并获取工作表中的数据。以下是一个示例：

import xlrd
打开Excel文件
workbook = xlrd.open_workbook('example.xls')
获取特定的工作表
sheet = workbook.sheet_by_name('Sheet1')
读取工作表中的数据
data = []
for row_idx in range(sheet.nrows):
    row = sheet.row_values(row_idx)
    data.append(row)
显示数据
for row in data:
    print(row)

在上面的代码中，我们使用xlrd.open_workbook函数打开Excel文件，并使用工作表名称获取特定的工作表。然后，使用sheet.row_values方法遍历工作表中的所有行，并将数据存储在列表中。

3.3 读取特定的单元格

可以使用行列索引读取特定的单元格数据：

# 读取特定的单元格
cell_value = sheet.cell_value(rowx=0, colx=0)
print(cell_value)

3.4 读取特定范围的数据

可以使用切片读取特定范围的数据：

# 读取特定范围的数据
for row_idx in range(0, 3):
    row = sheet.row_values(row_idx, start_colx=0, end_colx=3)
    print(row)

四、使用xlwt库写入Excel文件

xlwt库是一个用于写入Excel文件的库，适用于Excel 97-2003格式（.xls）。

4.1 安装xlwt库

首先，确保已经安装了xlwt库。可以使用以下命令进行安装：

pip install xlwt

4.2 写入Excel文件

使用xlwt库可以创建新的Excel文件，并写入数据。以下是一个示例：

import xlwt
创建工作簿
workbook = xlwt.Workbook()
创建工作表
sheet = workbook.add_sheet('Sheet1')
写入数据
data = [
    ['Name', 'Age', 'Gender'],
    ['Alice', 25, 'Female'],
    ['Bob', 30, 'Male'],
    ['Charlie', 35, 'Male']
]
for row_idx, row in enumerate(data):
    for col_idx, value in enumerate(row):
        sheet.write(row_idx, col_idx, value)
保存文件
workbook.save('example.xls')

在上面的代码中，我们使用xlwt.Workbook函数创建一个新的工作簿，并使用add_sheet方法创建一个新的工作表。然后，使用sheet.write方法将数据写入工作表中，最后使用workbook.save方法保存文件。

五、使用xlsxwriter库写入Excel文件

xlsxwriter库是一个用于写入Excel文件的库，适用于Excel 2007及以后的格式（.xlsx）。

5.1 安装xlsxwriter库

首先，确保已经安装了xlsxwriter库。可以使用以下命令进行安装：

pip install xlsxwriter

5.2 写入Excel文件

使用xlsxwriter库可以创建新的Excel文件，并写入数据。以下是一个示例：

import xlsxwriter
创建工作簿
workbook = xlsxwriter.Workbook('example.xlsx')
创建工作表
sheet = workbook.add_worksheet('Sheet1')
写入数据
data = [
    ['Name', 'Age', 'Gender'],
    ['Alice', 25, 'Female'],
    ['Bob', 30, 'Male'],
    ['Charlie', 35, 'Male']
]
for row_idx, row in enumerate(data):
    for col_idx, value in enumerate(row):
        sheet.write(row_idx, col_idx, value)
保存文件
workbook.close()

在上面的代码中，我们使用xlsxwriter.Workbook函数创建一个新的工作簿，并使用add_worksheet方法创建一个新的工作表。然后，使用sheet.write方法将数据写入工作表中，最后使用workbook.close方法保存文件。

六、使用pyexcel库处理Excel文件

pyexcel库是一个用于处理Excel文件的库，支持多种格式（.xls、.xlsx、.csv等）。它提供了简单的API，可以方便地进行数据读写。

6.1 安装pyexcel库

首先，确保已经安装了pyexcel库及其插件。可以使用以下命令进行安装：

pip install pyexcel pyexcel-xls pyexcel-xlsx

6.2 读取Excel文件

使用pyexcel库可以读取Excel文件，并获取工作表中的数据。以下是一个示例：

import pyexcel as p
读取Excel文件
data = p.get_sheet(file_name='example.xlsx')
显示数据
for row in data:
    print(row)

在上面的代码中，我们使用p.get_sheet函数读取Excel文件，并将数据存储在Sheet对象中。然后，遍历Sheet对象中的所有行，并显示数据。

6.3 写入Excel文件

使用pyexcel库可以创建新的Excel文件，并写入数据。以下是一个示例：

import pyexcel as p
写入数据
data = [
    ['Name', 'Age', 'Gender'],
    ['Alice', 25, 'Female'],
    ['Bob', 30, 'Male'],
    ['Charlie', 35, 'Male']
]
保存文件
p.save_as(array=data, dest_file_name='example.xlsx')

在上面的代码中，我们使用p.save_as函数将数据写入新的Excel文件中。

七、使用pyxlsb库读取Excel文件

pyxlsb库是一个用于读取Excel文件的库，适用于Excel Binary Workbook格式（.xlsb）。

7.1 安装pyxlsb库

首先，确保已经安装了pyxlsb库。可以使用以下命令进行安装：

pip install pyxlsb

7.2 读取Excel文件

使用pyxlsb库可以读取Excel文件，并获取工作表中的数据。以下是一个示例：

from pyxlsb import open_workbook
打开Excel文件
with open_workbook('example.xlsb') as wb:
    # 获取特定的工作表
    with wb.get_sheet('Sheet1') as sheet:
        # 读取工作表中的数据
        for row in sheet.rows():
            print([item.v for item in row])

在上面的代码中，我们使用open_workbook函数打开Excel文件，并使用工作表名称获取特定的工作表。然后，使用sheet.rows方法遍历工作表中的所有行，并显示数据。