OpenTTS 设置
返回 TTS 服务提供商概览
OpenTTS 是一个开源的 TTS 服务器,通过 Docker 在您自己的计算机上运行。无需账户、无需 API 密钥、数据不会离开您的设备。如果您已经安装了 Docker,设置大约只需 2 分钟。
注意: OpenTTS 使用的是较早的神经网络和基于规则的引擎。语音质量尚可使用,但明显比 ElevenLabs、Google Cloud 或 KittenTTS 更生硬机械。如果未来出现更好的本地方案,该选项可能会在后续版本中移除。
第 1 步:安装 Docker
Section titled “第 1 步:安装 Docker”如果您尚未安装 Docker:
- Linux (Ubuntu/Debian):
sudo apt install docker.io - Linux (Fedora):
sudo dnf install docker - macOS / Windows: 下载 Docker Desktop
第 2 步:启动 OpenTTS 服务器
Section titled “第 2 步:启动 OpenTTS 服务器”打开终端并运行:
docker run -d -p 5500:5500 --name opentts synesthesiam/opentts:en此命令会下载英语语音包(首次运行约 1.5 GB)并在后台启动服务器。服务器会持续运行,直到您手动停止它。
还提供其他语言包:de、fr、es、ru、nl、sv、it 等。如需所有语言(下载体积更大):
docker run -d -p 5500:5500 --name opentts synesthesiam/opentts:allCJK 警告: OpenTTS 对欧洲语言支持最佳。日语、中文和韩语文本无法被正确发音。对于 CJK 语言,请改用 ElevenLabs 或 Google Cloud。
第 3 步:配置 En Parlant~
Section titled “第 3 步:配置 En Parlant~”- 打开 En Parlant~,进入 设置(齿轮图标)> 声音 选项卡
- 向下滚动到 TTS 部分
- 将 TTS 服务提供商 设置为 OpenTTS (Self-Hosted)
- 确认 OpenTTS 服务器 URL 为
http://localhost:5500 - TTS 语音 下拉菜单将显示可用的语音。尝试选择一个 larynx 语音(如
harvard)以获得最佳质量 - 将 文本转语音 设置为 开启
- 点击语音选择器旁边的 测试 按钮
您应该能听到一步棋的语音播报。
语音质量指南
Section titled “语音质量指南”语音来自 OpenTTS 中捆绑的多个引擎。从最佳到最基础排列如下:
- Larynx — 神经网络引擎,最自然
- Coqui-TTS — 神经网络引擎,多说话人
- MaryTTS — 基于 Java,质量尚可
- Festival — 传统合成
- eSpeak — 声音机械但速度快
语音下拉菜单会在括号中显示引擎名称,方便您按需选择。
OpenTTS 容器在后台运行。常用命令:
# Stop the serverdocker stop opentts
# Start it againdocker start opentts
# Remove it entirelydocker rm -f opentts
# Check if it's runningdocker ps | grep opentts- 出现”Connection refused”错误? Docker 容器可能未在运行。运行
docker ps进行检查。如果未列出,请使用docker start opentts启动它,或重新运行第 2 步中的docker run命令。 - 下拉菜单中没有语音? 确保容器正在运行且可通过
http://localhost:5500访问。您可以在浏览器中打开该 URL 进行测试——应该能看到 OpenTTS 的 Web 界面。 - 语音听起来非常机械? 尝试切换到 Larynx 语音——它们是 OpenTTS 中质量最高的选项。如果您想要更好的整体质量,可以考虑升级到 KittenTTS、Google Cloud 或 ElevenLabs。