python如何读取音频并播放

在Python中读取和播放音频有多种方法。最常用的库包括pydub、pygame、soundfile和simpleaudio等。这些库提供了读取、处理和播放音频文件的功能。其中，pydub和pygame是最常用的库，适合初学者。接下来我们将详细介绍如何使用pydub和pygame库读取和播放音频。

一、使用`pydub`库读取和播放音频

pydub是一个处理音频文件的强大库，支持多种格式，包括MP3、WAV、OGG等。

1、安装`pydub`

首先，您需要安装pydub库和ffmpeg，ffmpeg是一个处理多媒体数据的开源项目，pydub依赖于它来处理音频格式。

pip install pydub

安装ffmpeg可以通过以下方式：

在Windows上，可以下载ffmpeg的压缩包并将其解压到某个目录，然后将该目录添加到系统的PATH环境变量中。
在macOS上，可以使用Homebrew安装ffmpeg：

brew install ffmpeg

在Linux上，可以使用包管理器安装ffmpeg：

sudo apt-get install ffmpeg

2、读取和播放音频

以下是使用pydub读取和播放音频的示例代码：

from pydub import AudioSegment
from pydub.playback import play
读取音频文件
audio = AudioSegment.from_file("path/to/your/audiofile.mp3")
播放音频
play(audio)

在这段代码中，我们首先导入了AudioSegment和play函数。然后使用AudioSegment.from_file方法读取音频文件，并将其存储在audio变量中。最后，使用play函数播放音频。

二、使用`pygame`库读取和播放音频

pygame是一个跨平台的Python模块，用于开发视频游戏，但它也有处理音频的功能。

1、安装`pygame`

首先，您需要安装pygame库：

pip install pygame

2、读取和播放音频

以下是使用pygame读取和播放音频的示例代码：

import pygame
初始化pygame的混音器模块
pygame.mixer.init()
加载音频文件
pygame.mixer.music.load("path/to/your/audiofile.mp3")
播放音频
pygame.mixer.music.play()
保持程序运行直到音频播放完毕
while pygame.mixer.music.get_busy():
    pygame.time.Clock().tick(10)

在这段代码中，我们首先导入了pygame模块。然后使用pygame.mixer.init初始化混音器模块，并使用pygame.mixer.music.load方法加载音频文件。接下来，使用pygame.mixer.music.play方法播放音频。最后，我们使用一个循环来保持程序运行，直到音频播放完毕。

三、使用`soundfile`库读取音频

soundfile是一个用于读取和写入声音文件的库，支持多种文件格式，如WAV、FLAC、OGG等。

1、安装`soundfile`

首先，您需要安装soundfile库：

pip install soundfile

2、读取音频

以下是使用soundfile读取音频的示例代码：

import soundfile as sf
读取音频文件
data, samplerate = sf.read("path/to/your/audiofile.wav")
print("采样率:", samplerate)
print("音频数据:", data)

在这段代码中，我们首先导入了soundfile模块。然后使用sf.read方法读取音频文件，并将音频数据和采样率分别存储在data和samplerate变量中。最后，我们打印出采样率和音频数据。

四、使用`simpleaudio`库播放音频

simpleaudio是一个简单的音频播放库，支持WAV格式的音频文件。

1、安装`simpleaudio`

首先，您需要安装simpleaudio库：

pip install simpleaudio

2、播放音频

以下是使用simpleaudio播放音频的示例代码：

import simpleaudio as sa
加载音频文件
wave_obj = sa.WaveObject.from_wave_file("path/to/your/audiofile.wav")
播放音频
play_obj = wave_obj.play()
等待音频播放完毕
play_obj.wAIt_done()

在这段代码中，我们首先导入了simpleaudio模块。然后使用sa.WaveObject.from_wave_file方法加载音频文件，并将其存储在wave_obj变量中。接下来，使用wave_obj.play方法播放音频，并将播放对象存储在play_obj变量中。最后，使用play_obj.wait_done方法等待音频播放完毕。

五、其他常用音频处理库

除了上述介绍的库外，Python还有其他一些常用的音频处理库，如librosa、wave、scipy.io.wavfile等。

1、使用`librosa`库读取音频

librosa是一个用于音频处理的Python库，提供了许多高级功能，如音频特征提取、音频效果处理等。

1.1 安装`librosa`

首先，您需要安装librosa库：

pip install librosa

1.2 读取音频

以下是使用librosa读取音频的示例代码：

import librosa
读取音频文件
y, sr = librosa.load("path/to/your/audiofile.mp3")
print("采样率:", sr)
print("音频数据:", y)

在这段代码中，我们首先导入了librosa模块。然后使用librosa.load方法读取音频文件，并将音频数据和采样率分别存储在y和sr变量中。最后，我们打印出采样率和音频数据。

2、使用`wave`库读取和写入WAV文件

wave是Python标准库中的一个模块，用于处理WAV格式的音频文件。

2.1 读取WAV文件

以下是使用wave读取WAV文件的示例代码：

import wave
打开WAV文件
with wave.open("path/to/your/audiofile.wav", 'rb') as wf:
    # 获取音频参数
    params = wf.getparams()
    print("音频参数:", params)
    # 读取音频数据
    frames = wf.readframes(wf.getnframes())
    print("音频数据:", frames)

在这段代码中，我们首先导入了wave模块。然后使用wave.open方法打开WAV文件，并使用wf.getparams方法获取音频参数。接下来，使用wf.readframes方法读取音频数据。

2.2 写入WAV文件

以下是使用wave写入WAV文件的示例代码：

import wave
打开WAV文件用于写入
with wave.open("output.wav", 'wb') as wf:
    # 设置音频参数
    wf.setnchannels(1)  # 单声道
    wf.setsampwidth(2)  # 16位采样
    wf.setframerate(44100)  # 采样率
    # 写入音频数据
    wf.writeframes(b'YOUR_AUDIO_DATA')

在这段代码中，我们首先导入了wave模块。然后使用wave.open方法打开一个新的WAV文件用于写入，并使用wf.setnchannels、wf.setsampwidth和wf.setframerate方法设置音频参数。最后，使用wf.writeframes方法写入音频数据。

六、音频处理的实际应用

音频处理在实际应用中有很多场景，例如语音识别、音乐信息检索、音频编辑等。下面介绍几个常见的应用场景。

1、语音识别

语音识别是将语音转换为文本的技术。Python中常用的语音识别库包括SpeechRecognition、pocketsphinx等。

1.1 使用`SpeechRecognition`库进行语音识别

SpeechRecognition是一个用于语音识别的Python库，支持多种语音识别引擎。

安装`SpeechRecognition`

首先，您需要安装SpeechRecognition库：

pip install SpeechRecognition

语音识别示例代码

import speech_recognition as sr
创建识别器实例
recognizer = sr.Recognizer()
读取音频文件
with sr.AudioFile("path/to/your/audiofile.wav") as source:
    audio = recognizer.record(source)
进行语音识别
try:
    text = recognizer.recognize_google(audio)
    print("识别结果:", text)
except sr.UnknownValueError:
    print("无法识别音频")
except sr.RequestError as e:
    print(f"请求错误: {e}")

在这段代码中，我们首先导入了speech_recognition模块。然后创建了一个识别器实例，并使用sr.AudioFile读取音频文件。接下来，使用recognizer.record方法记录音频。最后，使用recognizer.recognize_google方法进行语音识别，并打印识别结果。

2、音乐信息检索

音乐信息检索是从音乐信号中提取信息的技术，例如音乐分类、音乐推荐等。Python中常用的音乐信息检索库包括librosa、madmom等。

2.1 使用`librosa`提取音频特征

以下是使用librosa提取音频特征的示例代码：

import librosa
import numpy as np
读取音频文件
y, sr = librosa.load("path/to/your/audiofile.mp3")
提取梅尔频谱
mel_spectrogram = librosa.feature.melspectrogram(y=y, sr=sr)
mel_spectrogram_db = librosa.power_to_db(mel_spectrogram, ref=np.max)
print("梅尔频谱:", mel_spectrogram_db)

在这段代码中，我们首先导入了librosa和numpy模块。然后使用librosa.load方法读取音频文件，并使用librosa.feature.melspectrogram方法提取梅尔频谱。最后，我们将梅尔频谱转换为分贝尺度，并打印结果。

2.2 使用`madmom`进行节拍检测

madmom是一个用于音乐信息检索的Python库，提供了节拍检测、音调识别等功能。

安装`madmom`

首先，您需要安装madmom库：

pip install madmom

节拍检测示例代码

from madmom.features.beats import RNNBeatProcessor, DBNBeatTrackingProcessor
读取音频文件并进行节拍检测
proc = DBNBeatTrackingProcessor()
act = RNNBeatProcessor()(r"path/to/your/audiofile.wav")
beats = proc(act)
print("节拍时间点:", beats)

在这段代码中，我们首先导入了madmom.features.beats模块中的RNNBeatProcessor和DBNBeatTrackingProcessor类。然后使用RNNBeatProcessor读取音频文件并提取节拍激活函数，接着使用DBNBeatTrackingProcessor进行节拍检测，并打印节拍时间点。

3、音频编辑

音频编辑是对音频信号进行处理和修改的技术，例如剪切、拼接、添加效果等。Python中常用的音频编辑库包括pydub、audioread等。

3.1 使用`pydub`进行音频编辑

以下是使用pydub进行音频剪切和拼接的示例代码：

from pydub import AudioSegment
读取音频文件
audio1 = AudioSegment.from_file("path/to/your/audiofile1.mp3")
audio2 = AudioSegment.from_file("path/to/your/audiofile2.mp3")
剪切音频
start_time = 10 * 1000  # 开始时间（毫秒）
end_time = 20 * 1000  # 结束时间（毫秒）
audio1_cut = audio1[start_time:end_time]
拼接音频
audio_combined = audio1_cut + audio2
保存编辑后的音频
audio_combined.export("output.mp3", format="mp3")

在这段代码中，我们首先导入了pydub模块中的AudioSegment类。然后使用AudioSegment.from_file方法读取两个音频文件。接下来，我们通过切片操作剪切音频，并通过加法操作拼接音频。最后，使用audio_combined.export方法保存编辑后的音频。

七、小结

通过上述介绍，我们可以看到Python提供了丰富的库和工具来处理音频文件。pydub和pygame是最常用的库，适合初学者，它们分别用于音频编辑和游戏音频处理。soundfile和simpleaudio也提供了简单易用的音频读取和播放功能。此外，librosa和madmom等高级库可以用于更复杂的音频分析和音乐信息检索。

通过合理选择和使用这些库，您可以轻松地实现音频读取、播放、编辑和分析等功能。希望本文对您有所帮助，并能在您的音频处理项目中提供参考。

标签云

IT项目需求变更技术文档管理文档结构化 ICT项目管理内网办公文档管理企业文档 PM工程项目旅游项目创业项目可视化管理

2026-07-02
1

未分类

2026知名CRM汇总：7款客户管理系统优选

2026-06-30
2

未分类

企业CRM选型必读：7家本土厂商核心能力对照与建议

2026-06-23
3

未分类

新锐产品逆势突围，10款特色CRM核心亮点盘点

2026-06-19
2

未分类

2026年CRM市场：9款头部产品差异化优势与适用边界

2026-06-17
3

未分类

2026年六大技术标杆 CRM 深度解读：选型思路与核心实力对照

2026-06-11
2

未分类

目前较好的 CRM 管理系统有哪些？2026 年9 款CRM平台推荐

2026-06-11
9

未分类

企业甄选 CRM 参考：5 款主流产品多维度测评

2026-06-07
3

未分类

国内外13款CRM 系统对比：企业数字化转型的优选搭档

2026-06-03
2

未分类

2026CRM横评：精选8款主流平台，帮企业快速做选择

2026-05-31
2

未分类

python如何读取音频并播放

一、使用pydub库读取和播放音频

1、安装pydub

2、读取和播放音频

读取音频文件

播放音频

二、使用pygame库读取和播放音频

1、安装pygame

2、读取和播放音频

初始化pygame的混音器模块

加载音频文件

播放音频

保持程序运行直到音频播放完毕

三、使用soundfile库读取音频

1、安装soundfile

2、读取音频

读取音频文件

四、使用simpleaudio库播放音频

1、安装simpleaudio

2、播放音频

加载音频文件

播放音频

等待音频播放完毕

五、其他常用音频处理库

1、使用librosa库读取音频

1.1 安装librosa

1.2 读取音频

读取音频文件

2、使用wave库读取和写入WAV文件

2.1 读取WAV文件

打开WAV文件

2.2 写入WAV文件

打开WAV文件用于写入

六、音频处理的实际应用

1、语音识别

1.1 使用SpeechRecognition库进行语音识别

安装SpeechRecognition

语音识别示例代码

创建识别器实例

读取音频文件

进行语音识别

2、音乐信息检索

2.1 使用librosa提取音频特征

读取音频文件

提取梅尔频谱

2.2 使用madmom进行节拍检测

安装madmom

节拍检测示例代码

读取音频文件并进行节拍检测

3、音频编辑

3.1 使用pydub进行音频编辑

读取音频文件

剪切音频

拼接音频

保存编辑后的音频

七、小结

相关问答FAQs：

推荐文章

相关阅读

标签云

2026年十款主流CRM系统全面对比：从核心需求出发，找准适配自家业务的管理利器

2026知名CRM汇总：7款客户管理系统优选

企业CRM选型必读：7家本土厂商核心能力对照与建议

新锐产品逆势突围，10款特色CRM核心亮点盘点

2026年CRM市场：9款头部产品差异化优势与适用边界

2026年六大技术标杆 CRM 深度解读：选型思路与核心实力对照

目前较好的 CRM 管理系统有哪些？2026 年9 款CRM平台推荐

企业甄选 CRM 参考：5 款主流产品多维度测评

国内外13款CRM 系统对比：企业数字化转型的优选搭档

2026CRM横评：精选8款主流平台，帮企业快速做选择

400-800-1024

违法和不良信息举报邮箱：abuse@worktile.com

一、使用`pydub`库读取和播放音频

1、安装`pydub`

二、使用`pygame`库读取和播放音频

1、安装`pygame`

三、使用`soundfile`库读取音频

1、安装`soundfile`

四、使用`simpleaudio`库播放音频

1、安装`simpleaudio`

1、使用`librosa`库读取音频

1.1 安装`librosa`

2、使用`wave`库读取和写入WAV文件

1.1 使用`SpeechRecognition`库进行语音识别

安装`SpeechRecognition`

2.1 使用`librosa`提取音频特征

2.2 使用`madmom`进行节拍检测

安装`madmom`

3.1 使用`pydub`进行音频编辑