python中统计性分析的实例

作者：William Gu发布时间：2026-03-28 23:04阅读时长：13 分钟阅读次数：71

常见问答

如何使用Python进行描述性统计分析？

想了解怎样用Python来计算数据的均值、中位数和标准差等基本描述性统计指标。

Python描述性统计分析方法

可以借助pandas库中的DataFrame对象，使用describe()方法快速获得均值、中位数、标准差、最大值和最小值等统计信息。此外，numpy库中的mean(), median(), std()函数也能实现这些功能。代码示例如下：

import pandas as pd
import numpy as np

data = [10, 20, 30, 40, 50]

使用pandas获取描述性统计

series = pd.Series(data)
print(series.describe())

print(np.mean(data))
print(np.median(data))
print(np.std(data))

Python如何进行相关性分析？

想知道如何利用Python判断两个变量之间的相关关系，比如计算皮尔森相关系数。

Python实现相关性分析的方法

可以使用pandas库中的corr()函数计算DataFrame中不同变量之间的相关系数。若需要计算单对变量的皮尔森相关系数，可使用scipy.stats库中的pearsonr方法。示例如下：

import pandas as pd
from scipy.stats import pearsonr

data = {'x': [1, 2, 3, 4, 5], 'y': [2, 4, 5, 4, 5]}
df = pd.DataFrame(data)

print(df.corr())

corr_coef, p_value = pearsonr(df['x'], df['y'])
print(f'相关系数: {corr_coef}, p值: {p_value}')

如何使用Python进行回归分析？

需要利用Python对数据执行线性回归分析，应该使用什么库及基本流程。

Python线性回归分析指导

Python中可使用statsmodels或scikit-learn库完成线性回归。以scikit-learn为例，先准备特征矩阵和目标变量，然后提前拟合模型，再查看回归系数和截距。示范代码：

from sklearn.linear_model import LinearRegression
import numpy as np

X = np.array([[1], [2], [3], [4], [5]]) # 特征
y = np.array([2, 4, 5, 4, 5]) # 目标