跳转到内容

OpenTTS 设置

返回 TTS 服务提供商概览

OpenTTS 是一个开源的 TTS 服务器,通过 Docker 在您自己的计算机上运行。无需账户、无需 API 密钥、数据不会离开您的设备。如果您已经安装了 Docker,设置大约只需 2 分钟。

注意: OpenTTS 使用的是较早的神经网络和基于规则的引擎。语音质量尚可使用,但明显比 ElevenLabs、Google Cloud 或 KittenTTS 更生硬机械。如果未来出现更好的本地方案,该选项可能会在后续版本中移除。

如果您尚未安装 Docker:

  • Linux (Ubuntu/Debian): sudo apt install docker.io
  • Linux (Fedora): sudo dnf install docker
  • macOS / Windows: 下载 Docker Desktop

打开终端并运行:

Terminal window
docker run -d -p 5500:5500 --name opentts synesthesiam/opentts:en

此命令会下载英语语音包(首次运行约 1.5 GB)并在后台启动服务器。服务器会持续运行,直到您手动停止它。

还提供其他语言包:defresrunlsvit 等。如需所有语言(下载体积更大):

Terminal window
docker run -d -p 5500:5500 --name opentts synesthesiam/opentts:all

CJK 警告: OpenTTS 对欧洲语言支持最佳。日语、中文和韩语文本无法被正确发音。对于 CJK 语言,请改用 ElevenLabs 或 Google Cloud。

  1. 打开 En Parlant~,进入 设置(齿轮图标)> 声音 选项卡
  2. 向下滚动到 TTS 部分
  3. TTS 服务提供商 设置为 OpenTTS (Self-Hosted)
  4. 确认 OpenTTS 服务器 URLhttp://localhost:5500
  5. TTS 语音 下拉菜单将显示可用的语音。尝试选择一个 larynx 语音(如 harvard)以获得最佳质量
  6. 文本转语音 设置为 开启
  7. 点击语音选择器旁边的 测试 按钮

您应该能听到一步棋的语音播报。

语音来自 OpenTTS 中捆绑的多个引擎。从最佳到最基础排列如下:

  1. Larynx — 神经网络引擎,最自然
  2. Coqui-TTS — 神经网络引擎,多说话人
  3. MaryTTS — 基于 Java,质量尚可
  4. Festival — 传统合成
  5. eSpeak — 声音机械但速度快

语音下拉菜单会在括号中显示引擎名称,方便您按需选择。

OpenTTS 容器在后台运行。常用命令:

Terminal window
# Stop the server
docker stop opentts
# Start it again
docker start opentts
# Remove it entirely
docker rm -f opentts
# Check if it's running
docker ps | grep opentts
  • 出现”Connection refused”错误? Docker 容器可能未在运行。运行 docker ps 进行检查。如果未列出,请使用 docker start opentts 启动它,或重新运行第 2 步中的 docker run 命令。
  • 下拉菜单中没有语音? 确保容器正在运行且可通过 http://localhost:5500 访问。您可以在浏览器中打开该 URL 进行测试——应该能看到 OpenTTS 的 Web 界面。
  • 语音听起来非常机械? 尝试切换到 Larynx 语音——它们是 OpenTTS 中质量最高的选项。如果您想要更好的整体质量,可以考虑升级到 KittenTTS、Google Cloud 或 ElevenLabs。