怎么用python提取基频

作者：Rhett Bai发布时间：2026-03-25阅读时长：0 分钟阅读次数：3

用户关注问题

Python中有哪些库可以用来提取音频基频？

我想知道在Python环境下，有哪些常用的库或工具能够帮助我从音频文件中提取基频?

常用的Python库推荐

Python中常用的音频处理库包括librosa、pyAudioAnalysis以及praat-parselmouth。其中librosa提供了丰富的音频特征提取功能，包含基频估计；praat-parselmouth是Praat软件的Python接口，适合做语音基频分析；pyAudioAnalysis也具备提取音高相关特征的能力。选择具体库通常根据项目需求及个人熟悉度决定。

提取基频时需要对音频进行哪些预处理？

在使用Python提取基频之前，对音频数据是否有特定的预处理步骤需要执行？这对提取结果的准确性有何影响？

基频提取的预处理步骤和作用

基频提取前通常会对音频进行降噪、归一化和分帧处理。降噪可以提升信噪比，使基频估计更稳定；归一化有助于统一音频幅度，避免因音量差异影响算法表现；分帧则是将音频分成短时段，便于分析局部时频特征，提高基频检测的时效性和精度。合理的预处理对提升基频提取结果有积极作用。

Python中如何用代码实现基频的提取？

我希望获得一个简单的Python示例，演示如何利用现有库从音频文件中提取基频。

利用librosa提取基频的基本示例

可以借助librosa库中的pyin函数提取基频。示例代码如下：

import librosa
import numpy as np

y, sr = librosa.load('audio.wav')

f0, voiced_flag, voiced_probs = librosa.pyin(y, fmin=librosa.note_to_hz('C2'), fmax=librosa.note_to_hz('C7'))

# f0即为基频数组，未检测到基频的位置为NaN

print(f0)

这个代码会加载音频文件，计算在指定频率范围内的基频，返回的f0是基频序列，可以进一步分析或可视化。

标签：

信号处理音频分析编程实践