OpenTTS-Einrichtung

Zurück zur Übersicht der TTS-Anbieter

OpenTTS ist ein Open-Source-TTS-Server, der über Docker auf Ihrem eigenen Computer läuft. Kein Konto, kein API-Schlüssel, keine Daten, die Ihren Rechner verlassen. Die Einrichtung dauert etwa 2 Minuten, wenn Docker bereits installiert ist.

Hinweis: OpenTTS verwendet ältere neuronale und regelbasierte Engines. Die Sprachqualität ist funktional, klingt aber merklich roboterhafter als bei ElevenLabs, Google Cloud oder KittenTTS. OpenTTS wird möglicherweise in einer zukünftigen Version entfernt, wenn bessere lokale Alternativen verfügbar werden.

Schritt 1: Docker installieren

Falls Docker noch nicht installiert ist:

Linux (Ubuntu/Debian): sudo apt install docker.io
Linux (Fedora): sudo dnf install docker
macOS / Windows: Laden Sie Docker Desktop herunter

Schritt 2: Den OpenTTS-Server starten

Öffnen Sie ein Terminal und führen Sie folgenden Befehl aus:

docker run -d -p 5500:5500 --name opentts synesthesiam/opentts:en

Dieser Befehl lädt das englische Sprachpaket herunter (~1,5 GB beim ersten Start) und startet den Server im Hintergrund. Er läuft, bis Sie ihn stoppen.

Andere Sprachen

Weitere Sprachpakete sind verfügbar: de, fr, es, ru, nl, sv, it und mehr. Für alle Sprachen (größerer Download):

docker run -d -p 5500:5500 --name opentts synesthesiam/opentts:all

CJK-Warnung: OpenTTS funktioniert am besten mit europäischen Sprachen. Japanischer, chinesischer und koreanischer Text wird nicht korrekt ausgesprochen. Verwenden Sie für CJK-Sprachen stattdessen ElevenLabs oder Google Cloud.

Schritt 3: En Parlant~ konfigurieren

Öffnen Sie En Parlant~ und navigieren Sie zu Einstellungen (Zahnradsymbol) > Reiter Sound
Scrollen Sie nach unten zum TTS-Bereich
Setzen Sie TTS-Anbieter auf OpenTTS (Self-Hosted)
Vergewissern Sie sich, dass die OpenTTS Server URL auf http://localhost:5500 eingestellt ist
Das Dropdown-Menü TTS-Stimme wird mit den verfügbaren Stimmen befüllt. Probieren Sie eine larynx-Stimme (z. B. harvard) für die beste Qualität
Setzen Sie Text-to-Speech auf Ein
Klicken Sie auf die Schaltfläche Test neben der Stimmauswahl

Sie sollten einen Schachzug laut vorgelesen hören.

Leitfaden zur Stimmqualität

Die Stimmen stammen von mehreren in OpenTTS gebündelten Engines. Von der besten bis zur einfachsten:

Larynx — neuronal, am natürlichsten klingend
Coqui-TTS — neuronal, mehrere Sprecher
MaryTTS — Java-basiert, passable Qualität
Festival — traditionelle Synthese
eSpeak — roboterhaft, aber schnell

Im Stimmen-Dropdown wird der Engine-Name in Klammern angezeigt, sodass Sie entsprechend auswählen können.

Server verwalten

Der OpenTTS-Container läuft im Hintergrund. Häufig verwendete Befehle:

# Stop the server
docker stop opentts

# Start it again
docker start opentts

# Remove it entirely
docker rm -f opentts

# Check if it's running
docker ps | grep opentts

Fehlerbehebung

Fehler „Connection refused”? Der Docker-Container läuft möglicherweise nicht. Prüfen Sie mit docker ps, ob er aktiv ist. Falls er nicht aufgelistet ist, starten Sie ihn mit docker start opentts oder führen Sie den docker run-Befehl aus Schritt 2 erneut aus.
Keine Stimmen im Dropdown? Stellen Sie sicher, dass der Container läuft und unter http://localhost:5500 erreichbar ist. Sie können dies testen, indem Sie diese URL in Ihrem Browser öffnen – Sie sollten die OpenTTS-Weboberfläche sehen.
Stimmen klingen sehr roboterhaft? Wechseln Sie zu einer Larynx-Stimme – diese bieten die höchste Qualität in OpenTTS. Wenn Sie insgesamt eine bessere Qualität wünschen, ziehen Sie ein Upgrade auf KittenTTS, Google Cloud oder ElevenLabs in Betracht.