Oppsett av OpenTTS

Tilbake til Oversikt over TTS-leverandører

OpenTTS er en åpen kildekode TTS-server som kjører på din egen maskin ved hjelp av Docker. Ingen konto, ingen API-nøkkel, ingen data som forlater maskinen din. Oppsettet tar omtrent 2 minutter hvis du allerede har Docker installert.

Merk: OpenTTS bruker eldre nevrale og regelbaserte motorer. Stemmekvaliteten er funksjonell, men merkbart mer robotaktig enn ElevenLabs, Google Cloud eller KittenTTS. Det kan bli fjernet i en fremtidig versjon dersom bedre lokale alternativer dukker opp.

Steg 1: Installer Docker

Hvis du ikke har Docker ennå:

Linux (Ubuntu/Debian): sudo apt install docker.io
Linux (Fedora): sudo dnf install docker
macOS / Windows: Last ned Docker Desktop

Steg 2: Start OpenTTS-serveren

Åpne en terminal og kjør:

docker run -d -p 5500:5500 --name opentts synesthesiam/opentts:en

Dette laster ned den engelske stemmepakken (~1,5 GB ved første kjøring) og starter serveren i bakgrunnen. Den kjører til du stopper den.

Andre språk

Andre språkpakker er tilgjengelige: de, fr, es, ru, nl, sv, it, og flere. For alle språk (større nedlasting):

docker run -d -p 5500:5500 --name opentts synesthesiam/opentts:all

CJK-advarsel: OpenTTS fungerer best med europeiske språk. Japansk, kinesisk og koreansk tekst vil ikke bli uttalt korrekt. For CJK-språk bør du bruke ElevenLabs eller Google Cloud i stedet.

Steg 3: Konfigurer En Parlant~

Åpne En Parlant~ og gå til Innstillinger (tannhjulikonet) > fanen Lyd
Bla ned til TTS-seksjonen
Sett TTS-leverandør til OpenTTS (Self-Hosted)
Bekreft at OpenTTS Server URL er http://localhost:5500
Nedtrekkslisten TTS-stemme fylles med tilgjengelige stemmer. Prøv en larynx-stemme (som harvard) for best kvalitet
Sett Tekst-til-tale til På
Klikk på Test-knappen ved siden av stemmevelgeren

Du bør høre et sjakktrekk lest opp.

Guide for stemmekvalitet

Stemmene kommer fra flere motorer som er inkludert i OpenTTS. Fra best til mest grunnleggende:

Larynx — nevral, mest naturlig lyd
Coqui-TTS — nevral, flere talere
MaryTTS — Java-basert, grei kvalitet
Festival — tradisjonell syntese
eSpeak — robotaktig, men rask

Nedtrekkslisten for stemmer viser motornavnet i parentes, slik at du kan velge deretter.

Administrere serveren

OpenTTS-containeren kjører i bakgrunnen. Vanlige kommandoer:

# Stop the server
docker stop opentts

# Start it again
docker start opentts

# Remove it entirely
docker rm -f opentts

# Check if it's running
docker ps | grep opentts

Feilsøking

«Connection refused»-feil? Docker-containeren kjører kanskje ikke. Kjør docker ps for å sjekke. Hvis den ikke er oppført, start den med docker start opentts eller kjør docker run-kommandoen fra steg 2 på nytt.
Ingen stemmer i nedtrekkslisten? Sørg for at containeren kjører og er tilgjengelig på http://localhost:5500. Du kan teste ved å åpne den URL-en i nettleseren din — du bør se OpenTTS-webgrensesnittet.
Stemmene høres veldig robotaktige ut? Prøv å bytte til en Larynx-stemme — de har den høyeste kvaliteten i OpenTTS. Hvis du ønsker bedre kvalitet generelt, bør du vurdere å oppgradere til KittenTTS, Google Cloud eller ElevenLabs.