Salta ai contenuti

Configurazione di OpenTTS

Torna alla Panoramica dei provider TTS

OpenTTS è un server TTS open-source che funziona sul tuo computer tramite Docker. Nessun account, nessuna chiave API, nessun dato che lascia la tua macchina. La configurazione richiede circa 2 minuti se hai già Docker installato.

Nota: OpenTTS utilizza motori neurali e rule-based più datati. La qualità vocale è funzionale ma notevolmente più robotica rispetto a ElevenLabs, Google Cloud o KittenTTS. Potrebbe essere rimosso in una versione futura se emergeranno migliori opzioni locali.

Se non hai ancora Docker:

  • Linux (Ubuntu/Debian): sudo apt install docker.io
  • Linux (Fedora): sudo dnf install docker
  • macOS / Windows: Scarica Docker Desktop

Apri un terminale ed esegui:

Terminal window
docker run -d -p 5500:5500 --name opentts synesthesiam/opentts:en

Questo scarica il pacchetto vocale inglese (~1,5 GB alla prima esecuzione) e avvia il server in background. Rimane in esecuzione finché non lo fermi.

Sono disponibili altri pacchetti linguistici: de, fr, es, ru, nl, sv, it e altri. Per tutte le lingue (download più grande):

Terminal window
docker run -d -p 5500:5500 --name opentts synesthesiam/opentts:all

Avvertenza CJK: OpenTTS funziona meglio con le lingue europee. Il testo in giapponese, cinese e coreano non verrà pronunciato correttamente. Per le lingue CJK, utilizza invece ElevenLabs o Google Cloud.

  1. Apri En Parlant~ e vai su Impostazioni (icona dell’ingranaggio) > scheda Audio
  2. Scorri verso il basso fino alla sezione TTS
  3. Imposta Provider TTS su OpenTTS (Self-Hosted)
  4. Verifica che l’URL del server OpenTTS sia http://localhost:5500
  5. Il menu a tendina Voce TTS si popolerà con le voci disponibili. Prova una voce larynx (come harvard) per la migliore qualità
  6. Imposta Text-to-Speech su Attivo
  7. Fai clic sul pulsante Test accanto al selettore della voce

Dovresti sentire una mossa degli scacchi pronunciata ad alta voce.

Le voci provengono da diversi motori inclusi in OpenTTS. Dalla migliore alla più basilare:

  1. Larynx — neurale, dal suono più naturale
  2. Coqui-TTS — neurale, multi-speaker
  3. MaryTTS — basato su Java, qualità discreta
  4. Festival — sintesi tradizionale
  5. eSpeak — robotico ma veloce

Il menu a tendina delle voci mostra il nome del motore tra parentesi, così puoi scegliere di conseguenza.

Il container OpenTTS viene eseguito in background. Comandi comuni:

Terminal window
# Stop the server
docker stop opentts
# Start it again
docker start opentts
# Remove it entirely
docker rm -f opentts
# Check if it's running
docker ps | grep opentts
  • Errore “Connection refused”? Il container Docker potrebbe non essere in esecuzione. Esegui docker ps per verificare. Se non è elencato, avvialo con docker start opentts o riesegui il comando docker run del Passo 2.
  • Nessuna voce nel menu a tendina? Assicurati che il container sia in esecuzione e accessibile all’indirizzo http://localhost:5500. Puoi verificare aprendo quell’URL nel browser — dovresti vedere l’interfaccia web di OpenTTS.
  • Le voci suonano molto robotiche? Prova a passare a una voce Larynx — sono l’opzione di qualità più alta in OpenTTS. Se desideri una qualità complessiva migliore, considera il passaggio a KittenTTS, Google Cloud o ElevenLabs.