システムTTSのセットアップ
TTSプロバイダーの概要に戻る
システムTTSは、お使いのオペレーティングシステムに内蔵された音声合成を利用します。インストールするものは一切なく、すぐに動作します。
ご注意ください: システムTTSは無料で簡単に使えますが、相応の品質です。ほとんどのプラットフォームで音声品質は正直かなり低く、機械的で平坦、長めの注釈では聞き取りにくいこともあります。TTSナレーションの動作確認としては十分ですが、実際に学習で使うつもりであれば、文字通り他のどのプロバイダーに切り替えても改善されます。Google CloudやElevenLabsの無料枠ですら、劇的に優れています。
En Parlant~の設定
Section titled “En Parlant~の設定”- En Parlant~を開き、設定(歯車アイコン)> サウンドタブに移動します
- TTSプロバイダーを**System (OS Native)**に設定します
- 音声のドロップダウンに、システムで利用可能なすべての音声が表示されます
- テストボタンをクリックしてプレビューします
以上です。システムTTSはセットアップ不要ですぐに動作します。
OS別の音声品質
Section titled “OS別の音声品質”システム音声はオペレーティングシステムによって大きく異なります:
- macOS — 最も自然なシステム音声です。Appleの新しい音声(Samantha Enhancedなど)はかなり高品質です。
- Windows — SAPI音声はそこそこの品質です。Windows 10以降では、従来のものより音質の良いニューラル音声がいくつか含まれています。
- Linux — 通常、speech-dispatcher経由のeSpeak または Festival が使われます。macOSやWindowsよりも機械的ですが、機能的には問題ありません。
品質が物足りないと感じた場合は、KittenTTS(ローカル、無料)、Google Cloud、またはElevenLabsへのアップグレードをご検討ください。
Linuxでの追加音声のインストール
Section titled “Linuxでの追加音声のインストール”Linuxシステムでは、初期状態ではeSpeak音声が1つか2つしかないことが多いです。以下の方法で追加できます:
# Install all eSpeak language datasudo apt install espeak-ng-data-*
# Install Festival voicessudo apt install festvox-*
# Install speech-dispatcher voicessudo apt install speech-dispatcher-*新しい音声をインストールした後、En Parlant~を再起動すると音声ドロップダウンに反映されます。
言語サポート
Section titled “言語サポート”利用可能な言語は、お使いのOSとインストール済みの音声パックによって異なります。システムTTSは、オペレーティングシステムが提供する音声をそのまま使用します。包括的な多言語サポートが必要な場合は、ElevenLabsまたはGoogle Cloudをご利用ください。
トラブルシューティング
Section titled “トラブルシューティング”- ドロップダウンに音声が表示されない場合: Linuxでは、speech-dispatcherがインストールされていることを確認してください:
sudo apt install speech-dispatcher - 音声が歪んで聞こえる場合: ドロップダウンから別の音声を試してみてください。システム音声の中には、他のものより品質が良いものがあります。
- まったく音が出ない場合: システムのオーディオ設定を確認してください。システムTTSはデフォルトのオーディオ出力デバイスを使用します。