跳到內容

OpenTTS 設定

返回 TTS 語音合成服務總覽

OpenTTS 是一款開源的 TTS 伺服器,透過 Docker 在您自己的電腦上運行。不需要帳號、不需要 API 金鑰、資料不會離開您的設備。如果您已經安裝了 Docker,設定大約只需 2 分鐘。

注意: OpenTTS 使用較舊的神經網路與規則式引擎。語音品質堪用,但明顯比 ElevenLabs、Google Cloud 或 KittenTTS 更具機械感。若未來出現更好的本地方案,本選項可能會在後續版本中移除。

如果您尚未安裝 Docker:

  • Linux (Ubuntu/Debian): sudo apt install docker.io
  • Linux (Fedora): sudo dnf install docker
  • macOS / Windows: 下載 Docker Desktop

開啟終端機並執行:

Terminal window
docker run -d -p 5500:5500 --name opentts synesthesiam/opentts:en

這會下載英語語音包(首次執行約 1.5 GB)並在背景啟動伺服器。伺服器會持續運行直到您手動停止。

其他語言包也可供使用:defresrunlsvit 等。若需要所有語言(下載量較大):

Terminal window
docker run -d -p 5500:5500 --name opentts synesthesiam/opentts:all

中日韓文警告: OpenTTS 最適合用於歐洲語言。日文、中文和韓文的發音將無法正確呈現。若需使用中日韓語言,請改用 ElevenLabs 或 Google Cloud。

  1. 開啟 En Parlant~ 並前往 設定(齒輪圖示)> 音效 分頁
  2. 向下捲動至 TTS 區段
  3. TTS Provider 設為 OpenTTS (Self-Hosted)
  4. 確認 OpenTTS Server URLhttp://localhost:5500
  5. TTS Voice 下拉選單會自動載入可用的語音選項。建議嘗試 larynx 語音(如 harvard)以獲得最佳品質
  6. Text-to-Speech 設為 On
  7. 點擊語音選擇器旁的 Test 按鈕

您應該會聽到一步棋的語音播報。

OpenTTS 內建了多個語音引擎,品質由高到低排列如下:

  1. Larynx — 神經網路引擎,發音最自然
  2. Coqui-TTS — 神經網路引擎,支援多種說話者
  3. MaryTTS — 基於 Java,品質尚可
  4. Festival — 傳統語音合成
  5. eSpeak — 機械感重但速度快

語音下拉選單會在括號中顯示引擎名稱,方便您依需求選擇。

OpenTTS 容器會在背景運行。常用指令如下:

Terminal window
# 停止伺服器
docker stop opentts
# 重新啟動
docker start opentts
# 完全移除
docker rm -f opentts
# 檢查是否正在運行
docker ps | grep opentts
  • 出現「Connection refused」錯誤? Docker 容器可能未在運行。請執行 docker ps 檢查。如果沒有列出,請使用 docker start opentts 啟動,或重新執行步驟 2 中的 docker run 指令。
  • 下拉選單中沒有語音選項? 請確認容器正在運行,且可透過 http://localhost:5500 存取。您可以在瀏覽器中開啟該網址進行測試——應該會看到 OpenTTS 的網頁介面。
  • 語音聽起來非常機械? 請嘗試切換至 Larynx 語音——這是 OpenTTS 中品質最高的選項。如果您需要更好的整體品質,可考慮升級至 KittenTTS、Google Cloud 或 ElevenLabs。