Aller au contenu

Configuration d'OpenTTS

Retour à la Vue d’ensemble des fournisseurs TTS

OpenTTS est un serveur TTS open source qui s’exécute sur votre propre ordinateur via Docker. Pas de compte, pas de clé API, aucune donnée ne quitte votre machine. La configuration prend environ 2 minutes si Docker est déjà installé.

Remarque : OpenTTS utilise des moteurs neuronaux et à base de règles plus anciens. La qualité vocale est fonctionnelle mais sensiblement plus robotique que celle d’ElevenLabs, Google Cloud ou KittenTTS. Il pourrait être retiré dans une version future si de meilleures options locales apparaissent.

Si vous n’avez pas encore Docker :

  • Linux (Ubuntu/Debian) : sudo apt install docker.io
  • Linux (Fedora) : sudo dnf install docker
  • macOS / Windows : Téléchargez Docker Desktop

Ouvrez un terminal et exécutez :

Fenêtre de terminal
docker run -d -p 5500:5500 --name opentts synesthesiam/opentts:en

Cette commande télécharge le pack de voix anglaises (~1,5 Go au premier lancement) et démarre le serveur en arrière-plan. Il fonctionne jusqu’à ce que vous l’arrêtiez.

D’autres packs de langues sont disponibles : de, fr, es, ru, nl, sv, it, et d’autres encore. Pour toutes les langues (téléchargement plus volumineux) :

Fenêtre de terminal
docker run -d -p 5500:5500 --name opentts synesthesiam/opentts:all

Avertissement CJK : OpenTTS fonctionne mieux avec les langues européennes. Les textes en japonais, chinois et coréen ne seront pas prononcés correctement. Pour les langues CJK, utilisez plutôt ElevenLabs ou Google Cloud.

  1. Ouvrez En Parlant~ et accédez à Paramètres (icône d’engrenage) > onglet Son
  2. Faites défiler jusqu’à la section TTS
  3. Définissez Fournisseur TTS sur OpenTTS (Self-Hosted)
  4. Vérifiez que l’URL du serveur OpenTTS est bien http://localhost:5500
  5. Le menu déroulant Voix TTS se remplira avec les voix disponibles. Essayez une voix larynx (comme harvard) pour la meilleure qualité
  6. Réglez Synthèse vocale sur Activé
  7. Cliquez sur le bouton Test à côté du sélecteur de voix

Vous devriez entendre un coup d’échecs prononcé à voix haute.

Les voix proviennent de plusieurs moteurs intégrés dans OpenTTS. Du meilleur au plus basique :

  1. Larynx — neuronal, le plus naturel
  2. Coqui-TTS — neuronal, multi-locuteur
  3. MaryTTS — basé sur Java, qualité correcte
  4. Festival — synthèse traditionnelle
  5. eSpeak — robotique mais rapide

Le menu déroulant des voix affiche le nom du moteur entre parenthèses pour vous aider à choisir.

Le conteneur OpenTTS fonctionne en arrière-plan. Commandes courantes :

Fenêtre de terminal
# Arrêter le serveur
docker stop opentts
# Le redémarrer
docker start opentts
# Le supprimer entièrement
docker rm -f opentts
# Vérifier s'il est en cours d'exécution
docker ps | grep opentts
  • Erreur « Connection refused » ? Le conteneur Docker n’est peut-être pas en cours d’exécution. Lancez docker ps pour vérifier. S’il n’apparaît pas dans la liste, démarrez-le avec docker start opentts ou relancez la commande docker run de l’étape 2.
  • Aucune voix dans le menu déroulant ? Assurez-vous que le conteneur est en cours d’exécution et accessible à l’adresse http://localhost:5500. Vous pouvez tester en ouvrant cette URL dans votre navigateur — vous devriez voir l’interface web d’OpenTTS.
  • Les voix sont très robotiques ? Essayez de passer à une voix Larynx — ce sont les options de meilleure qualité dans OpenTTS. Si vous souhaitez une meilleure qualité globale, envisagez de passer à KittenTTS, Google Cloud ou ElevenLabs.