Configuration d'OpenTTS

Retour à la Vue d’ensemble des fournisseurs TTS

OpenTTS est un serveur TTS open source qui s’exécute sur votre propre ordinateur via Docker. Pas de compte, pas de clé API, aucune donnée ne quitte votre machine. La configuration prend environ 2 minutes si Docker est déjà installé.

Remarque : OpenTTS utilise des moteurs neuronaux et à base de règles plus anciens. La qualité vocale est fonctionnelle mais sensiblement plus robotique que celle d’ElevenLabs, Google Cloud ou KittenTTS. Il pourrait être retiré dans une version future si de meilleures options locales apparaissent.

Étape 1 : Installer Docker

Si vous n’avez pas encore Docker :

Linux (Ubuntu/Debian) : sudo apt install docker.io
Linux (Fedora) : sudo dnf install docker
macOS / Windows : Téléchargez Docker Desktop

Étape 2 : Démarrer le serveur OpenTTS

Ouvrez un terminal et exécutez :

docker run -d -p 5500:5500 --name opentts synesthesiam/opentts:en

Cette commande télécharge le pack de voix anglaises (~1,5 Go au premier lancement) et démarre le serveur en arrière-plan. Il fonctionne jusqu’à ce que vous l’arrêtiez.

Autres langues

D’autres packs de langues sont disponibles : de, fr, es, ru, nl, sv, it, et d’autres encore. Pour toutes les langues (téléchargement plus volumineux) :

docker run -d -p 5500:5500 --name opentts synesthesiam/opentts:all

Avertissement CJK : OpenTTS fonctionne mieux avec les langues européennes. Les textes en japonais, chinois et coréen ne seront pas prononcés correctement. Pour les langues CJK, utilisez plutôt ElevenLabs ou Google Cloud.

Étape 3 : Configurer En Parlant~

Ouvrez En Parlant~ et accédez à Paramètres (icône d’engrenage) > onglet Son
Faites défiler jusqu’à la section TTS
Définissez Fournisseur TTS sur OpenTTS (Self-Hosted)
Vérifiez que l’URL du serveur OpenTTS est bien http://localhost:5500
Le menu déroulant Voix TTS se remplira avec les voix disponibles. Essayez une voix larynx (comme harvard) pour la meilleure qualité
Réglez Synthèse vocale sur Activé
Cliquez sur le bouton Test à côté du sélecteur de voix

Vous devriez entendre un coup d’échecs prononcé à voix haute.

Guide de qualité des voix

Les voix proviennent de plusieurs moteurs intégrés dans OpenTTS. Du meilleur au plus basique :

Larynx — neuronal, le plus naturel
Coqui-TTS — neuronal, multi-locuteur
MaryTTS — basé sur Java, qualité correcte
Festival — synthèse traditionnelle
eSpeak — robotique mais rapide

Le menu déroulant des voix affiche le nom du moteur entre parenthèses pour vous aider à choisir.

Gestion du serveur

Le conteneur OpenTTS fonctionne en arrière-plan. Commandes courantes :

# Arrêter le serveur
docker stop opentts

# Le redémarrer
docker start opentts

# Le supprimer entièrement
docker rm -f opentts

# Vérifier s'il est en cours d'exécution
docker ps | grep opentts

Dépannage

Erreur « Connection refused » ? Le conteneur Docker n’est peut-être pas en cours d’exécution. Lancez docker ps pour vérifier. S’il n’apparaît pas dans la liste, démarrez-le avec docker start opentts ou relancez la commande docker run de l’étape 2.
Aucune voix dans le menu déroulant ? Assurez-vous que le conteneur est en cours d’exécution et accessible à l’adresse http://localhost:5500. Vous pouvez tester en ouvrant cette URL dans votre navigateur — vous devriez voir l’interface web d’OpenTTS.
Les voix sont très robotiques ? Essayez de passer à une voix Larynx — ce sont les options de meilleure qualité dans OpenTTS. Si vous souhaitez une meilleure qualité globale, envisagez de passer à KittenTTS, Google Cloud ou ElevenLabs.