python透视表如何加一列

在Python中使用透视表时，添加一列的方法有多种，主要有：通过DataFrame的直接操作、使用Pandas的apply函数、以及通过merge或join来合并新列。 其中，最常用的方法是通过DataFrame的直接操作和使用apply函数。我们可以通过直接添加一列新的数据，或通过对现有列进行计算来生成新列。下面将详细介绍这些方法。

一、通过DataFrame的直接操作添加新列

直接在DataFrame上添加新列是最简单的方法。可以直接给DataFrame赋值一个新的列名，值可以是一个标量、一个列表、一个Series或一个计算结果。

import pandas as pd
创建一个示例DataFrame
data = {
    'A': ['foo', 'foo', 'foo', 'bar', 'bar', 'bar'],
    'B': ['one', 'one', 'two', 'two', 'one', 'one'],
    'C': [1, 2, 3, 4, 5, 6],
    'D': [7, 8, 9, 10, 11, 12]
}
df = pd.DataFrame(data)
创建透视表
pivot_table = pd.pivot_table(df, values='D', index=['A', 'B'], columns=['C'])
添加新列
pivot_table['New_Column'] = pivot_table[1] + pivot_table[2]
print(pivot_table)

通过这种方式，我们可以将现有列的数据进行计算，生成一个新的列并添加到透视表中。

二、使用apply函数添加新列

在DataFrame中使用apply函数可以对每一行或每一列进行操作，并生成新的列。apply函数可以接受自定义的函数，并将其应用到DataFrame的每一行或每一列上。

import pandas as pd
创建一个示例DataFrame
data = {
    'A': ['foo', 'foo', 'foo', 'bar', 'bar', 'bar'],
    'B': ['one', 'one', 'two', 'two', 'one', 'one'],
    'C': [1, 2, 3, 4, 5, 6],
    'D': [7, 8, 9, 10, 11, 12]
}
df = pd.DataFrame(data)
创建透视表
pivot_table = pd.pivot_table(df, values='D', index=['A', 'B'], columns=['C'])
使用apply函数添加新列
pivot_table['New_Column'] = pivot_table.apply(lambda row: row[1] + row[2], axis=1)
print(pivot_table)

通过这种方式，可以对DataFrame的每一行进行操作，并生成新的列。apply函数提供了更大的灵活性，可以处理复杂的计算和操作。

三、通过merge或join合并新列

如果需要将一个新的DataFrame合并到现有的透视表中，可以使用merge或join方法。这种方法特别适用于需要从外部数据源添加新列的情况。

import pandas as pd
创建一个示例DataFrame
data = {
    'A': ['foo', 'foo', 'foo', 'bar', 'bar', 'bar'],
    'B': ['one', 'one', 'two', 'two', 'one', 'one'],
    'C': [1, 2, 3, 4, 5, 6],
    'D': [7, 8, 9, 10, 11, 12]
}
df = pd.DataFrame(data)
创建透视表
pivot_table = pd.pivot_table(df, values='D', index=['A', 'B'], columns=['C'])
创建一个新的DataFrame
new_data = {
    'A': ['foo', 'bar'],
    'B': ['one', 'two'],
    'New_Column': [100, 200]
}
new_df = pd.DataFrame(new_data)
合并新列
merged_table = pivot_table.reset_index().merge(new_df, on=['A', 'B']).set_index(['A', 'B'])
print(merged_table)

通过这种方式，可以将外部数据源中的数据合并到现有的透视表中，从而添加新的列。

四、使用条件语句添加新列

有时，我们需要根据某些条件来添加新的列。可以使用条件语句来生成新的列，并将其添加到透视表中。

import pandas as pd
创建一个示例DataFrame
data = {
    'A': ['foo', 'foo', 'foo', 'bar', 'bar', 'bar'],
    'B': ['one', 'one', 'two', 'two', 'one', 'one'],
    'C': [1, 2, 3, 4, 5, 6],
    'D': [7, 8, 9, 10, 11, 12]
}
df = pd.DataFrame(data)
创建透视表
pivot_table = pd.pivot_table(df, values='D', index=['A', 'B'], columns=['C'])
添加新列，值根据条件语句生成
pivot_table['New_Column'] = pivot_table.apply(lambda row: row[1] + row[2] if row[1] > 0 else 0, axis=1)
print(pivot_table)

通过这种方式，可以根据特定的条件生成新的列，并添加到透视表中。

五、通过自定义函数添加新列

有时，需要根据复杂的逻辑或计算生成新的列。可以定义一个自定义函数，并将其应用到DataFrame的每一行或每一列上，生成新的列。

import pandas as pd
创建一个示例DataFrame
data = {
    'A': ['foo', 'foo', 'foo', 'bar', 'bar', 'bar'],
    'B': ['one', 'one', 'two', 'two', 'one', 'one'],
    'C': [1, 2, 3, 4, 5, 6],
    'D': [7, 8, 9, 10, 11, 12]
}
df = pd.DataFrame(data)
创建透视表
pivot_table = pd.pivot_table(df, values='D', index=['A', 'B'], columns=['C'])
定义一个自定义函数
def custom_function(row):
    return row[1] + row[2] if row[1] > 0 else 0
使用自定义函数添加新列
pivot_table['New_Column'] = pivot_table.apply(custom_function, axis=1)
print(pivot_table)