コンテンツにスキップ

OpenTTS セットアップ

TTS プロバイダー概要に戻る

OpenTTS は、Docker を使用して自分のコンピュータ上で動作するオープンソースの TTS サーバーです。アカウントも API キーも不要で、データがマシンの外に出ることもありません。Docker がインストール済みであれば、セットアップは約2分で完了します。

注意: OpenTTS は旧世代のニューラルエンジンおよびルールベースエンジンを使用しています。音声品質は実用的ですが、ElevenLabs、Google Cloud、KittenTTS と比較すると明らかにロボット的です。より優れたローカルオプションが登場した場合、将来のリリースで削除される可能性があります。

ステップ 1: Docker のインストール

Section titled “ステップ 1: Docker のインストール”

Docker がまだインストールされていない場合:

  • Linux (Ubuntu/Debian): sudo apt install docker.io
  • Linux (Fedora): sudo dnf install docker
  • macOS / Windows: Docker Desktop をダウンロード

ステップ 2: OpenTTS サーバーの起動

Section titled “ステップ 2: OpenTTS サーバーの起動”

ターミナルを開いて以下を実行します:

Terminal window
docker run -d -p 5500:5500 --name opentts synesthesiam/opentts:en

これにより英語音声パック(初回実行時に約 1.5 GB)がダウンロードされ、サーバーがバックグラウンドで起動します。停止するまで動作し続けます。

他の言語パックも利用可能です: defresrunlsvit など。全言語パック(ダウンロードサイズが大きくなります)を使用する場合:

Terminal window
docker run -d -p 5500:5500 --name opentts synesthesiam/opentts:all

CJK に関する警告: OpenTTS はヨーロッパ言語で最も良く動作します。日本語、中国語、韓国語のテキストは正しく発音されません。CJK 言語については、ElevenLabs または Google Cloud をご利用ください。

  1. En Parlant~ を開き、Settings(歯車アイコン)> Sound タブに移動します
  2. TTS セクションまでスクロールします
  3. TTS ProviderOpenTTS (Self-Hosted) に設定します
  4. OpenTTS Server URLhttp://localhost:5500 になっていることを確認します
  5. TTS Voice ドロップダウンに利用可能な音声が表示されます。最高品質を得るには larynx 音声(harvard など)を試してください
  6. Text-to-SpeechOn に設定します
  7. 音声セレクターの横にある Test ボタンをクリックします

チェスの指し手が音声で読み上げられるはずです。

音声は OpenTTS にバンドルされた複数のエンジンから提供されます。品質の高い順に:

  1. Larynx — ニューラル、最も自然な音声
  2. Coqui-TTS — ニューラル、マルチスピーカー
  3. MaryTTS — Java ベース、まずまずの品質
  4. Festival — 従来型の音声合成
  5. eSpeak — ロボット的だが高速

音声ドロップダウンにはエンジン名が括弧内に表示されるため、それに応じて選択できます。

OpenTTS コンテナはバックグラウンドで動作します。よく使うコマンド:

Terminal window
# Stop the server
docker stop opentts
# Start it again
docker start opentts
# Remove it entirely
docker rm -f opentts
# Check if it's running
docker ps | grep opentts
  • 「Connection refused」エラーが出る場合: Docker コンテナが動作していない可能性があります。docker ps を実行して確認してください。リストに表示されない場合は、docker start opentts で起動するか、ステップ 2 の docker run コマンドを再実行してください。
  • ドロップダウンに音声が表示されない場合: コンテナが動作しており、http://localhost:5500 でアクセス可能であることを確認してください。ブラウザでその URL を開くとテストできます — OpenTTS の Web インターフェースが表示されるはずです。
  • 音声が非常にロボット的に聞こえる場合: Larynx 音声に切り替えてみてください — OpenTTS で最高品質のオプションです。全体的により良い品質を求める場合は、KittenTTS、Google Cloud、または ElevenLabs へのアップグレードをご検討ください。