Python实现文本到语音转换主要有以下两种主流方法,结合权威性和时效性信息整理如下:
一、使用 pyttsx3
库(跨平台支持)
-
安装库
通过命令行安装
pyttsx3
: $$ pip install pyttsx3 $$部分系统需额外安装语音包(如Windows需在语音设置中启用对应语音包)。
-
基本用法
import pyttsx3 engine = pyttsx3.init() engine.say("Hello, World!") engine.runAndWait()
- 可设置语速、音量、语音类型(如中文、英文)等属性。
-
保存为音频文件
engine.save_to_file("output.mp3", "output")
支持多种格式,如
.mp3
、.pcm
等。
二、使用百度语音合成 API(云端服务)
-
注册与配置
-
注册百度账号并创建语音合成应用,获取
AppID
、API Key
、Secret Key
。 -
安装百度AI-Python库: $$ pip install baidu-aip $$
-
-
调用接口
from aip import AipSpeech appid = "你的AppID" api_key = "你的API_KEY" secret_key = "你的Secret_KEY" client = AipSpeech(appid, api_key, secret_key) text = "你好,世界!" with open("output.mp3", "wb") as f: f.write(response["audio_content"])
- 支持多种声音选择(如男声、女声、方言)。
三、其他注意事项
-
系统兼容性 :
pyttsx3
适用于Windows、Linux等系统,百度API需网络连接。 -
性能与功能 :
pyttsx3
本地运行,适合简单场景;百度API支持更丰富的音色和批量处理,但依赖网络。
以上方法可根据需求选择,若需离线使用或更高音质,推荐百度API;若仅需基础功能,pyttsx3
更便捷。