システムTTSのセットアップ

システムTTSは、お使いのオペレーティングシステムに内蔵された音声合成を利用します。インストールするものは一切なく、すぐに動作します。

ご注意ください： システムTTSは無料で簡単に使えますが、相応の品質です。ほとんどのプラットフォームで音声品質は正直かなり低く、機械的で平坦、長めの注釈では聞き取りにくいこともあります。TTSナレーションの動作確認としては十分ですが、実際に学習で使うつもりであれば、文字通り他のどのプロバイダーに切り替えても改善されます。Google CloudやElevenLabsの無料枠ですら、劇的に優れています。

En Parlant~の設定

En Parlant~を開き、設定（歯車アイコン）> サウンドタブに移動します
TTSプロバイダーを**System (OS Native)**に設定します
音声のドロップダウンに、システムで利用可能なすべての音声が表示されます
テストボタンをクリックしてプレビューします

以上です。システムTTSはセットアップ不要ですぐに動作します。

OS別の音声品質

システム音声はオペレーティングシステムによって大きく異なります：

macOS — 最も自然なシステム音声です。Appleの新しい音声（Samantha Enhancedなど）はかなり高品質です。
Windows — SAPI音声はそこそこの品質です。Windows 10以降では、従来のものより音質の良いニューラル音声がいくつか含まれています。
Linux — 通常、speech-dispatcher経由のeSpeak または Festival が使われます。macOSやWindowsよりも機械的ですが、機能的には問題ありません。

品質が物足りないと感じた場合は、KittenTTS（ローカル、無料）、Google Cloud、またはElevenLabsへのアップグレードをご検討ください。

Linuxでの追加音声のインストール

Linuxシステムでは、初期状態ではeSpeak音声が1つか2つしかないことが多いです。以下の方法で追加できます：

# Install all eSpeak language data
sudo apt install espeak-ng-data-*

# Install Festival voices
sudo apt install festvox-*

# Install speech-dispatcher voices
sudo apt install speech-dispatcher-*

新しい音声をインストールした後、En Parlant~を再起動すると音声ドロップダウンに反映されます。

言語サポート

利用可能な言語は、お使いのOSとインストール済みの音声パックによって異なります。システムTTSは、オペレーティングシステムが提供する音声をそのまま使用します。包括的な多言語サポートが必要な場合は、ElevenLabsまたはGoogle Cloudをご利用ください。

トラブルシューティング

ドロップダウンに音声が表示されない場合： Linuxでは、speech-dispatcherがインストールされていることを確認してください：sudo apt install speech-dispatcher
音声が歪んで聞こえる場合： ドロップダウンから別の音声を試してみてください。システム音声の中には、他のものより品質が良いものがあります。
まったく音が出ない場合： システムのオーディオ設定を確認してください。システムTTSはデフォルトのオーディオ出力デバイスを使用します。