Gå til innholdet

Oppsett av OpenTTS

Tilbake til Oversikt over TTS-leverandører

OpenTTS er en åpen kildekode TTS-server som kjører på din egen maskin ved hjelp av Docker. Ingen konto, ingen API-nøkkel, ingen data som forlater maskinen din. Oppsettet tar omtrent 2 minutter hvis du allerede har Docker installert.

Merk: OpenTTS bruker eldre nevrale og regelbaserte motorer. Stemmekvaliteten er funksjonell, men merkbart mer robotaktig enn ElevenLabs, Google Cloud eller KittenTTS. Det kan bli fjernet i en fremtidig versjon dersom bedre lokale alternativer dukker opp.

Hvis du ikke har Docker ennå:

  • Linux (Ubuntu/Debian): sudo apt install docker.io
  • Linux (Fedora): sudo dnf install docker
  • macOS / Windows: Last ned Docker Desktop

Åpne en terminal og kjør:

Terminal window
docker run -d -p 5500:5500 --name opentts synesthesiam/opentts:en

Dette laster ned den engelske stemmepakken (~1,5 GB ved første kjøring) og starter serveren i bakgrunnen. Den kjører til du stopper den.

Andre språkpakker er tilgjengelige: de, fr, es, ru, nl, sv, it, og flere. For alle språk (større nedlasting):

Terminal window
docker run -d -p 5500:5500 --name opentts synesthesiam/opentts:all

CJK-advarsel: OpenTTS fungerer best med europeiske språk. Japansk, kinesisk og koreansk tekst vil ikke bli uttalt korrekt. For CJK-språk bør du bruke ElevenLabs eller Google Cloud i stedet.

  1. Åpne En Parlant~ og gå til Innstillinger (tannhjulikonet) > fanen Lyd
  2. Bla ned til TTS-seksjonen
  3. Sett TTS-leverandør til OpenTTS (Self-Hosted)
  4. Bekreft at OpenTTS Server URL er http://localhost:5500
  5. Nedtrekkslisten TTS-stemme fylles med tilgjengelige stemmer. Prøv en larynx-stemme (som harvard) for best kvalitet
  6. Sett Tekst-til-tale til
  7. Klikk på Test-knappen ved siden av stemmevelgeren

Du bør høre et sjakktrekk lest opp.

Stemmene kommer fra flere motorer som er inkludert i OpenTTS. Fra best til mest grunnleggende:

  1. Larynx — nevral, mest naturlig lyd
  2. Coqui-TTS — nevral, flere talere
  3. MaryTTS — Java-basert, grei kvalitet
  4. Festival — tradisjonell syntese
  5. eSpeak — robotaktig, men rask

Nedtrekkslisten for stemmer viser motornavnet i parentes, slik at du kan velge deretter.

OpenTTS-containeren kjører i bakgrunnen. Vanlige kommandoer:

Terminal window
# Stop the server
docker stop opentts
# Start it again
docker start opentts
# Remove it entirely
docker rm -f opentts
# Check if it's running
docker ps | grep opentts
  • «Connection refused»-feil? Docker-containeren kjører kanskje ikke. Kjør docker ps for å sjekke. Hvis den ikke er oppført, start den med docker start opentts eller kjør docker run-kommandoen fra steg 2 på nytt.
  • Ingen stemmer i nedtrekkslisten? Sørg for at containeren kjører og er tilgjengelig på http://localhost:5500. Du kan teste ved å åpne den URL-en i nettleseren din — du bør se OpenTTS-webgrensesnittet.
  • Stemmene høres veldig robotaktige ut? Prøv å bytte til en Larynx-stemme — de har den høyeste kvaliteten i OpenTTS. Hvis du ønsker bedre kvalitet generelt, bør du vurdere å oppgradere til KittenTTS, Google Cloud eller ElevenLabs.