コンテンツにスキップ

システムTTSのセットアップ

TTSプロバイダーの概要に戻る

システムTTSは、お使いのオペレーティングシステムに内蔵された音声合成を利用します。インストールするものは一切なく、すぐに動作します。

ご注意ください: システムTTSは無料で簡単に使えますが、相応の品質です。ほとんどのプラットフォームで音声品質は正直かなり低く、機械的で平坦、長めの注釈では聞き取りにくいこともあります。TTSナレーションの動作確認としては十分ですが、実際に学習で使うつもりであれば、文字通り他のどのプロバイダーに切り替えても改善されます。Google CloudやElevenLabsの無料枠ですら、劇的に優れています。

  1. En Parlant~を開き、設定(歯車アイコン)> サウンドタブに移動します
  2. TTSプロバイダーを**System (OS Native)**に設定します
  3. 音声のドロップダウンに、システムで利用可能なすべての音声が表示されます
  4. テストボタンをクリックしてプレビューします

以上です。システムTTSはセットアップ不要ですぐに動作します。

システム音声はオペレーティングシステムによって大きく異なります:

  • macOS — 最も自然なシステム音声です。Appleの新しい音声(Samantha Enhancedなど)はかなり高品質です。
  • Windows — SAPI音声はそこそこの品質です。Windows 10以降では、従来のものより音質の良いニューラル音声がいくつか含まれています。
  • Linux — 通常、speech-dispatcher経由のeSpeak または Festival が使われます。macOSやWindowsよりも機械的ですが、機能的には問題ありません。

品質が物足りないと感じた場合は、KittenTTS(ローカル、無料)、Google Cloud、またはElevenLabsへのアップグレードをご検討ください。

Linuxでの追加音声のインストール

Section titled “Linuxでの追加音声のインストール”

Linuxシステムでは、初期状態ではeSpeak音声が1つか2つしかないことが多いです。以下の方法で追加できます:

Terminal window
# Install all eSpeak language data
sudo apt install espeak-ng-data-*
# Install Festival voices
sudo apt install festvox-*
# Install speech-dispatcher voices
sudo apt install speech-dispatcher-*

新しい音声をインストールした後、En Parlant~を再起動すると音声ドロップダウンに反映されます。

利用可能な言語は、お使いのOSとインストール済みの音声パックによって異なります。システムTTSは、オペレーティングシステムが提供する音声をそのまま使用します。包括的な多言語サポートが必要な場合は、ElevenLabsまたはGoogle Cloudをご利用ください。

  • ドロップダウンに音声が表示されない場合: Linuxでは、speech-dispatcherがインストールされていることを確認してください:sudo apt install speech-dispatcher
  • 音声が歪んで聞こえる場合: ドロップダウンから別の音声を試してみてください。システム音声の中には、他のものより品質が良いものがあります。
  • まったく音が出ない場合: システムのオーディオ設定を確認してください。システムTTSはデフォルトのオーディオ出力デバイスを使用します。