OpenTTS 設定
返回 TTS 語音合成服務總覽
OpenTTS 是一款開源的 TTS 伺服器,透過 Docker 在您自己的電腦上運行。不需要帳號、不需要 API 金鑰、資料不會離開您的設備。如果您已經安裝了 Docker,設定大約只需 2 分鐘。
注意: OpenTTS 使用較舊的神經網路與規則式引擎。語音品質堪用,但明顯比 ElevenLabs、Google Cloud 或 KittenTTS 更具機械感。若未來出現更好的本地方案,本選項可能會在後續版本中移除。
步驟 1:安裝 Docker
Section titled “步驟 1:安裝 Docker”如果您尚未安裝 Docker:
- Linux (Ubuntu/Debian):
sudo apt install docker.io - Linux (Fedora):
sudo dnf install docker - macOS / Windows: 下載 Docker Desktop
步驟 2:啟動 OpenTTS 伺服器
Section titled “步驟 2:啟動 OpenTTS 伺服器”開啟終端機並執行:
docker run -d -p 5500:5500 --name opentts synesthesiam/opentts:en這會下載英語語音包(首次執行約 1.5 GB)並在背景啟動伺服器。伺服器會持續運行直到您手動停止。
其他語言包也可供使用:de、fr、es、ru、nl、sv、it 等。若需要所有語言(下載量較大):
docker run -d -p 5500:5500 --name opentts synesthesiam/opentts:all中日韓文警告: OpenTTS 最適合用於歐洲語言。日文、中文和韓文的發音將無法正確呈現。若需使用中日韓語言,請改用 ElevenLabs 或 Google Cloud。
步驟 3:設定 En Parlant~
Section titled “步驟 3:設定 En Parlant~”- 開啟 En Parlant~ 並前往 設定(齒輪圖示)> 音效 分頁
- 向下捲動至 TTS 區段
- 將 TTS Provider 設為 OpenTTS (Self-Hosted)
- 確認 OpenTTS Server URL 為
http://localhost:5500 - TTS Voice 下拉選單會自動載入可用的語音選項。建議嘗試 larynx 語音(如
harvard)以獲得最佳品質 - 將 Text-to-Speech 設為 On
- 點擊語音選擇器旁的 Test 按鈕
您應該會聽到一步棋的語音播報。
語音品質指南
Section titled “語音品質指南”OpenTTS 內建了多個語音引擎,品質由高到低排列如下:
- Larynx — 神經網路引擎,發音最自然
- Coqui-TTS — 神經網路引擎,支援多種說話者
- MaryTTS — 基於 Java,品質尚可
- Festival — 傳統語音合成
- eSpeak — 機械感重但速度快
語音下拉選單會在括號中顯示引擎名稱,方便您依需求選擇。
OpenTTS 容器會在背景運行。常用指令如下:
# 停止伺服器docker stop opentts
# 重新啟動docker start opentts
# 完全移除docker rm -f opentts
# 檢查是否正在運行docker ps | grep opentts- 出現「Connection refused」錯誤? Docker 容器可能未在運行。請執行
docker ps檢查。如果沒有列出,請使用docker start opentts啟動,或重新執行步驟 2 中的docker run指令。 - 下拉選單中沒有語音選項? 請確認容器正在運行,且可透過
http://localhost:5500存取。您可以在瀏覽器中開啟該網址進行測試——應該會看到 OpenTTS 的網頁介面。 - 語音聽起來非常機械? 請嘗試切換至 Larynx 語音——這是 OpenTTS 中品質最高的選項。如果您需要更好的整體品質,可考慮升級至 KittenTTS、Google Cloud 或 ElevenLabs。