OpenTTS 设置

OpenTTS 是一个开源的 TTS 服务器，通过 Docker 在您自己的计算机上运行。无需账户、无需 API 密钥、数据不会离开您的设备。如果您已经安装了 Docker，设置大约只需 2 分钟。

注意： OpenTTS 使用的是较早的神经网络和基于规则的引擎。语音质量尚可使用，但明显比 ElevenLabs、Google Cloud 或 KittenTTS 更生硬机械。如果未来出现更好的本地方案，该选项可能会在后续版本中移除。

第 1 步：安装 Docker

如果您尚未安装 Docker：

Linux (Ubuntu/Debian)： sudo apt install docker.io
Linux (Fedora)： sudo dnf install docker
macOS / Windows： 下载 Docker Desktop

第 2 步：启动 OpenTTS 服务器

打开终端并运行：

docker run -d -p 5500:5500 --name opentts synesthesiam/opentts:en

此命令会下载英语语音包（首次运行约 1.5 GB）并在后台启动服务器。服务器会持续运行，直到您手动停止它。

其他语言

还提供其他语言包：de、fr、es、ru、nl、sv、it 等。如需所有语言（下载体积更大）：

docker run -d -p 5500:5500 --name opentts synesthesiam/opentts:all

CJK 警告： OpenTTS 对欧洲语言支持最佳。日语、中文和韩语文本无法被正确发音。对于 CJK 语言，请改用 ElevenLabs 或 Google Cloud。

第 3 步：配置 En Parlant~

打开 En Parlant~，进入设置（齿轮图标）> 声音选项卡
向下滚动到 TTS 部分
将 TTS 服务提供商 设置为 OpenTTS (Self-Hosted)
确认 OpenTTS 服务器 URL 为 http://localhost:5500
TTS 语音 下拉菜单将显示可用的语音。尝试选择一个 larynx 语音（如 harvard）以获得最佳质量
将 文本转语音 设置为开启
点击语音选择器旁边的测试按钮

您应该能听到一步棋的语音播报。

语音质量指南

语音来自 OpenTTS 中捆绑的多个引擎。从最佳到最基础排列如下：

Larynx — 神经网络引擎，最自然
Coqui-TTS — 神经网络引擎，多说话人
MaryTTS — 基于 Java，质量尚可
Festival — 传统合成
eSpeak — 声音机械但速度快

语音下拉菜单会在括号中显示引擎名称，方便您按需选择。

管理服务器

OpenTTS 容器在后台运行。常用命令：

# Stop the server
docker stop opentts

# Start it again
docker start opentts

# Remove it entirely
docker rm -f opentts

# Check if it's running
docker ps | grep opentts

故障排除

出现”Connection refused”错误？ Docker 容器可能未在运行。运行 docker ps 进行检查。如果未列出，请使用 docker start opentts 启动它，或重新运行第 2 步中的 docker run 命令。
下拉菜单中没有语音？ 确保容器正在运行且可通过 http://localhost:5500 访问。您可以在浏览器中打开该 URL 进行测试——应该能看到 OpenTTS 的 Web 界面。
语音听起来非常机械？ 尝试切换到 Larynx 语音——它们是 OpenTTS 中质量最高的选项。如果您想要更好的整体质量，可以考虑升级到 KittenTTS、Google Cloud 或 ElevenLabs。