在python中如何选择多列数据

在Python中，选择多列数据的常用方法是通过使用Pandas库。可以使用列标签、列索引、iloc方法、loc方法等来选择多列数据，其中使用loc方法来选择多列数据是最灵活和常见的方式。loc方法允许通过标签索引来选取特定的行和列，这种方法对数据的处理非常直观和高效。下面详细介绍其中一种方法——使用loc方法选择多列数据。

首先，确保已经安装了Pandas库。如果没有安装，可以使用以下命令进行安装：

pip install pandas

接下来，我们通过具体的例子来展示如何使用loc方法选择多列数据。

一、使用`loc`方法选择多列数据

Pandas的loc方法基于标签索引来选取数据，可以选择特定行、列或行列的组合。假设我们有以下一个数据框：

import pandas as pd
data = {
    'Name': ['Alice', 'Bob', 'Charlie', 'David'],
    'Age': [24, 27, 22, 32],
    'City': ['New York', 'Los Angeles', 'Chicago', 'Houston'],
    'Salary': [70000, 80000, 65000, 90000]
}
df = pd.DataFrame(data)

为了选择Name和Salary这两列的数据，可以使用如下代码：

selected_columns = df.loc[:, ['Name', 'Salary']]
print(selected_columns)

这段代码中，:表示选择所有行，['Name', 'Salary']表示选择这两列的标签。结果将会是一个新的数据框，包含Name和Salary列的数据。

二、使用列标签选择多列数据

除了使用loc方法，还可以通过列标签直接选择多列数据。假设我们有以下数据框：

import pandas as pd
data = {
    'Name': ['Alice', 'Bob', 'Charlie', 'David'],
    'Age': [24, 27, 22, 32],
    'City': ['New York', 'Los Angeles', 'Chicago', 'Houston'],
    'Salary': [70000, 80000, 65000, 90000]
}
df = pd.DataFrame(data)

为了选择Name和City这两列的数据，可以使用如下代码：

selected_columns = df[['Name', 'City']]
print(selected_columns)

这段代码中，[['Name', 'City']]通过列标签直接选择相应的列。结果将会是一个新的数据框，包含Name和City列的数据。

三、使用列索引选择多列数据

在某些情况下，可能需要通过列索引选择多列数据。假设我们有以下数据框：

import pandas as pd
data = {
    'Name': ['Alice', 'Bob', 'Charlie', 'David'],
    'Age': [24, 27, 22, 32],
    'City': ['New York', 'Los Angeles', 'Chicago', 'Houston'],
    'Salary': [70000, 80000, 65000, 90000]
}
df = pd.DataFrame(data)

为了选择第1列和第3列的数据，可以使用如下代码：

selected_columns = df.iloc[:, [0, 2]]
print(selected_columns)

这段代码中，:表示选择所有行，[0, 2]表示选择第1列和第3列。结果将会是一个新的数据框，包含第1列和第3列的数据。

四、混合使用标签和索引选择多列数据

有时需要混合使用标签和索引来选择多列数据。假设我们有以下数据框：

import pandas as pd
data = {
    'Name': ['Alice', 'Bob', 'Charlie', 'David'],
    'Age': [24, 27, 22, 32],
    'City': ['New York', 'Los Angeles', 'Chicago', 'Houston'],
    'Salary': [70000, 80000, 65000, 90000]
}
df = pd.DataFrame(data)

为了选择第1列和列标签为City的数据，可以使用如下代码：

selected_columns = df.loc[:, ['Name', 'City']]
print(selected_columns)

这段代码中，:表示选择所有行，['Name', 'City']表示选择第1列和列标签为City的列。结果将会是一个新的数据框，包含第1列和列标签为City的列的数据。

五、使用布尔索引选择多列数据

在某些情况下，可能需要使用布尔索引选择多列数据。假设我们有以下数据框：

import pandas as pd
data = {
    'Name': ['Alice', 'Bob', 'Charlie', 'David'],
    'Age': [24, 27, 22, 32],
    'City': ['New York', 'Los Angeles', 'Chicago', 'Houston'],
    'Salary': [70000, 80000, 65000, 90000]
}
df = pd.DataFrame(data)

为了选择Age大于25的行，并选择Name和City这两列的数据，可以使用如下代码：

selected_columns = df.loc[df['Age'] > 25, ['Name', 'City']]
print(selected_columns)

这段代码中，df['Age'] > 25表示选择Age大于25的行，['Name', 'City']表示选择Name和City这两列。结果将会是一个新的数据框，包含Age大于25的行和Name、City这两列的数据。

六、使用条件选择多列数据

在某些情况下，可能需要使用条件选择多列数据。假设我们有以下数据框：

import pandas as pd
data = {
    'Name': ['Alice', 'Bob', 'Charlie', 'David'],
    'Age': [24, 27, 22, 32],
    'City': ['New York', 'Los Angeles', 'Chicago', 'Houston'],
    'Salary': [70000, 80000, 65000, 90000]
}
df = pd.DataFrame(data)

为了选择Salary大于75000的行，并选择Name和Salary这两列的数据，可以使用如下代码：

selected_columns = df.loc[df['Salary'] > 75000, ['Name', 'Salary']]
print(selected_columns)

这段代码中，df['Salary'] > 75000表示选择Salary大于75000的行，['Name', 'Salary']表示选择Name和Salary这两列。结果将会是一个新的数据框，包含Salary大于75000的行和Name、Salary这两列的数据。

七、使用切片选择多列数据

在某些情况下，可能需要使用切片选择多列数据。假设我们有以下数据框：

import pandas as pd
data = {
    'Name': ['Alice', 'Bob', 'Charlie', 'David'],
    'Age': [24, 27, 22, 32],
    'City': ['New York', 'Los Angeles', 'Chicago', 'Houston'],
    'Salary': [70000, 80000, 65000, 90000]
}
df = pd.DataFrame(data)

为了选择第2列到第4列的数据，可以使用如下代码：

selected_columns = df.iloc[:, 1:4]
print(selected_columns)

这段代码中，:表示选择所有行，1:4表示选择第2列到第4列。结果将会是一个新的数据框，包含第2列到第4列的数据。

八、使用函数选择多列数据

在某些情况下，可能需要使用函数选择多列数据。假设我们有以下数据框：

import pandas as pd
data = {
    'Name': ['Alice', 'Bob', 'Charlie', 'David'],
    'Age': [24, 27, 22, 32],
    'City': ['New York', 'Los Angeles', 'Chicago', 'Houston'],
    'Salary': [70000, 80000, 65000, 90000]
}
df = pd.DataFrame(data)

为了选择列名以S开头的数据，可以使用如下代码：

selected_columns = df.loc[:, df.columns.str.startswith('S')]
print(selected_columns)

这段代码中，df.columns.str.startswith('S')表示选择列名以S开头的列。结果将会是一个新的数据框，包含列名以S开头的列的数据。

九、使用正则表达式选择多列数据

在某些情况下，可能需要使用正则表达式选择多列数据。假设我们有以下数据框：

import pandas as pd
data = {
    'Name': ['Alice', 'Bob', 'Charlie', 'David'],
    'Age': [24, 27, 22, 32],
    'City': ['New York', 'Los Angeles', 'Chicago', 'Houston'],
    'Salary': [70000, 80000, 65000, 90000]
}
df = pd.DataFrame(data)

为了选择列名包含a的数据，可以使用如下代码：

selected_columns = df.loc[:, df.columns.str.contAIns('a')]
print(selected_columns)

这段代码中，df.columns.str.contains('a')表示选择列名包含a的列。结果将会是一个新的数据框，包含列名包含a的列的数据。

十、使用`query`方法选择多列数据

在某些情况下，可能需要使用query方法选择多列数据。假设我们有以下数据框：

import pandas as pd
data = {
    'Name': ['Alice', 'Bob', 'Charlie', 'David'],
    'Age': [24, 27, 22, 32],
    'City': ['New York', 'Los Angeles', 'Chicago', 'Houston'],
    'Salary': [70000, 80000, 65000, 90000]
}
df = pd.DataFrame(data)

为了选择Age大于25的行，并选择Name和City这两列的数据，可以使用如下代码：

selected_columns = df.query('Age > 25')[['Name', 'City']]
print(selected_columns)

这段代码中，query('Age > 25')表示选择Age大于25的行，[['Name', 'City']]表示选择Name和City这两列。结果将会是一个新的数据框，包含Age大于25的行和Name、City这两列的数据。

总结

通过以上方法，我们可以灵活地选择多列数据。无论是通过标签、索引、切片、条件、布尔索引、正则表达式还是query方法，都可以方便地选择需要的列数据。选择合适的方法，可以提高数据处理的效率和代码的可读性。希望这些方法能够帮助你在数据分析和处理过程中更加高效地选择多列数据。

标签云

IT项目需求变更技术文档管理文档结构化 ICT项目管理内网办公文档管理企业文档 PM工程项目旅游项目创业项目可视化管理

2026-07-02
1

未分类

2026知名CRM汇总：7款客户管理系统优选

2026-06-30
2

未分类

企业CRM选型必读：7家本土厂商核心能力对照与建议

2026-06-23
3

未分类

新锐产品逆势突围，10款特色CRM核心亮点盘点

2026-06-19
2

未分类

2026年CRM市场：9款头部产品差异化优势与适用边界

2026-06-17
3

未分类

2026年六大技术标杆 CRM 深度解读：选型思路与核心实力对照

2026-06-11
2

未分类

目前较好的 CRM 管理系统有哪些？2026 年9 款CRM平台推荐

2026-06-11
9

未分类

企业甄选 CRM 参考：5 款主流产品多维度测评

2026-06-07
3

未分类

国内外13款CRM 系统对比：企业数字化转型的优选搭档

2026-06-03
2

未分类

2026CRM横评：精选8款主流平台，帮企业快速做选择

2026-05-31
2

未分类

在python中 如何选择多列数据

一、使用loc方法选择多列数据