OpenTTS セットアップ

TTS プロバイダー概要に戻る

OpenTTS は、Docker を使用して自分のコンピュータ上で動作するオープンソースの TTS サーバーです。アカウントも API キーも不要で、データがマシンの外に出ることもありません。Docker がインストール済みであれば、セットアップは約2分で完了します。

注意: OpenTTS は旧世代のニューラルエンジンおよびルールベースエンジンを使用しています。音声品質は実用的ですが、ElevenLabs、Google Cloud、KittenTTS と比較すると明らかにロボット的です。より優れたローカルオプションが登場した場合、将来のリリースで削除される可能性があります。

ステップ 1: Docker のインストール

Docker がまだインストールされていない場合:

Linux (Ubuntu/Debian): sudo apt install docker.io
Linux (Fedora): sudo dnf install docker
macOS / Windows: Docker Desktop をダウンロード

ステップ 2: OpenTTS サーバーの起動

ターミナルを開いて以下を実行します:

docker run -d -p 5500:5500 --name opentts synesthesiam/opentts:en

これにより英語音声パック（初回実行時に約 1.5 GB）がダウンロードされ、サーバーがバックグラウンドで起動します。停止するまで動作し続けます。

他の言語

他の言語パックも利用可能です: de、fr、es、ru、nl、sv、it など。全言語パック（ダウンロードサイズが大きくなります）を使用する場合:

docker run -d -p 5500:5500 --name opentts synesthesiam/opentts:all

CJK に関する警告: OpenTTS はヨーロッパ言語で最も良く動作します。日本語、中国語、韓国語のテキストは正しく発音されません。CJK 言語については、ElevenLabs または Google Cloud をご利用ください。

ステップ 3: En Parlant~ の設定

En Parlant~ を開き、Settings（歯車アイコン）> Sound タブに移動します
TTS セクションまでスクロールします
TTS Provider を OpenTTS (Self-Hosted) に設定します
OpenTTS Server URL が http://localhost:5500 になっていることを確認します
TTS Voice ドロップダウンに利用可能な音声が表示されます。最高品質を得るには larynx 音声（harvard など）を試してください
Text-to-Speech を On に設定します
音声セレクターの横にある Test ボタンをクリックします

チェスの指し手が音声で読み上げられるはずです。

音声品質ガイド

音声は OpenTTS にバンドルされた複数のエンジンから提供されます。品質の高い順に:

Larynx — ニューラル、最も自然な音声
Coqui-TTS — ニューラル、マルチスピーカー
MaryTTS — Java ベース、まずまずの品質
Festival — 従来型の音声合成
eSpeak — ロボット的だが高速

音声ドロップダウンにはエンジン名が括弧内に表示されるため、それに応じて選択できます。

サーバーの管理

OpenTTS コンテナはバックグラウンドで動作します。よく使うコマンド:

# Stop the server
docker stop opentts

# Start it again
docker start opentts

# Remove it entirely
docker rm -f opentts

# Check if it's running
docker ps | grep opentts

トラブルシューティング

「Connection refused」エラーが出る場合: Docker コンテナが動作していない可能性があります。docker ps を実行して確認してください。リストに表示されない場合は、docker start opentts で起動するか、ステップ 2 の docker run コマンドを再実行してください。
ドロップダウンに音声が表示されない場合: コンテナが動作しており、http://localhost:5500 でアクセス可能であることを確認してください。ブラウザでその URL を開くとテストできます — OpenTTS の Web インターフェースが表示されるはずです。
音声が非常にロボット的に聞こえる場合: Larynx 音声に切り替えてみてください — OpenTTS で最高品質のオプションです。全体的により良い品質を求める場合は、KittenTTS、Google Cloud、または ElevenLabs へのアップグレードをご検討ください。