Zum Inhalt springen

OpenTTS-Einrichtung

Zurück zur Übersicht der TTS-Anbieter

OpenTTS ist ein Open-Source-TTS-Server, der über Docker auf Ihrem eigenen Computer läuft. Kein Konto, kein API-Schlüssel, keine Daten, die Ihren Rechner verlassen. Die Einrichtung dauert etwa 2 Minuten, wenn Docker bereits installiert ist.

Hinweis: OpenTTS verwendet ältere neuronale und regelbasierte Engines. Die Sprachqualität ist funktional, klingt aber merklich roboterhafter als bei ElevenLabs, Google Cloud oder KittenTTS. OpenTTS wird möglicherweise in einer zukünftigen Version entfernt, wenn bessere lokale Alternativen verfügbar werden.

Falls Docker noch nicht installiert ist:

  • Linux (Ubuntu/Debian): sudo apt install docker.io
  • Linux (Fedora): sudo dnf install docker
  • macOS / Windows: Laden Sie Docker Desktop herunter

Öffnen Sie ein Terminal und führen Sie folgenden Befehl aus:

Terminal-Fenster
docker run -d -p 5500:5500 --name opentts synesthesiam/opentts:en

Dieser Befehl lädt das englische Sprachpaket herunter (~1,5 GB beim ersten Start) und startet den Server im Hintergrund. Er läuft, bis Sie ihn stoppen.

Weitere Sprachpakete sind verfügbar: de, fr, es, ru, nl, sv, it und mehr. Für alle Sprachen (größerer Download):

Terminal-Fenster
docker run -d -p 5500:5500 --name opentts synesthesiam/opentts:all

CJK-Warnung: OpenTTS funktioniert am besten mit europäischen Sprachen. Japanischer, chinesischer und koreanischer Text wird nicht korrekt ausgesprochen. Verwenden Sie für CJK-Sprachen stattdessen ElevenLabs oder Google Cloud.

  1. Öffnen Sie En Parlant~ und navigieren Sie zu Einstellungen (Zahnradsymbol) > Reiter Sound
  2. Scrollen Sie nach unten zum TTS-Bereich
  3. Setzen Sie TTS-Anbieter auf OpenTTS (Self-Hosted)
  4. Vergewissern Sie sich, dass die OpenTTS Server URL auf http://localhost:5500 eingestellt ist
  5. Das Dropdown-Menü TTS-Stimme wird mit den verfügbaren Stimmen befüllt. Probieren Sie eine larynx-Stimme (z. B. harvard) für die beste Qualität
  6. Setzen Sie Text-to-Speech auf Ein
  7. Klicken Sie auf die Schaltfläche Test neben der Stimmauswahl

Sie sollten einen Schachzug laut vorgelesen hören.

Die Stimmen stammen von mehreren in OpenTTS gebündelten Engines. Von der besten bis zur einfachsten:

  1. Larynx — neuronal, am natürlichsten klingend
  2. Coqui-TTS — neuronal, mehrere Sprecher
  3. MaryTTS — Java-basiert, passable Qualität
  4. Festival — traditionelle Synthese
  5. eSpeak — roboterhaft, aber schnell

Im Stimmen-Dropdown wird der Engine-Name in Klammern angezeigt, sodass Sie entsprechend auswählen können.

Der OpenTTS-Container läuft im Hintergrund. Häufig verwendete Befehle:

Terminal-Fenster
# Stop the server
docker stop opentts
# Start it again
docker start opentts
# Remove it entirely
docker rm -f opentts
# Check if it's running
docker ps | grep opentts
  • Fehler „Connection refused”? Der Docker-Container läuft möglicherweise nicht. Prüfen Sie mit docker ps, ob er aktiv ist. Falls er nicht aufgelistet ist, starten Sie ihn mit docker start opentts oder führen Sie den docker run-Befehl aus Schritt 2 erneut aus.
  • Keine Stimmen im Dropdown? Stellen Sie sicher, dass der Container läuft und unter http://localhost:5500 erreichbar ist. Sie können dies testen, indem Sie diese URL in Ihrem Browser öffnen – Sie sollten die OpenTTS-Weboberfläche sehen.
  • Stimmen klingen sehr roboterhaft? Wechseln Sie zu einer Larynx-Stimme – diese bieten die höchste Qualität in OpenTTS. Wenn Sie insgesamt eine bessere Qualität wünschen, ziehen Sie ein Upgrade auf KittenTTS, Google Cloud oder ElevenLabs in Betracht.