Configurazione di OpenTTS

Torna alla Panoramica dei provider TTS

OpenTTS è un server TTS open-source che funziona sul tuo computer tramite Docker. Nessun account, nessuna chiave API, nessun dato che lascia la tua macchina. La configurazione richiede circa 2 minuti se hai già Docker installato.

Nota: OpenTTS utilizza motori neurali e rule-based più datati. La qualità vocale è funzionale ma notevolmente più robotica rispetto a ElevenLabs, Google Cloud o KittenTTS. Potrebbe essere rimosso in una versione futura se emergeranno migliori opzioni locali.

Passo 1: Installare Docker

Se non hai ancora Docker:

Linux (Ubuntu/Debian): sudo apt install docker.io
Linux (Fedora): sudo dnf install docker
macOS / Windows: Scarica Docker Desktop

Passo 2: Avviare il server OpenTTS

Apri un terminale ed esegui:

docker run -d -p 5500:5500 --name opentts synesthesiam/opentts:en

Questo scarica il pacchetto vocale inglese (~1,5 GB alla prima esecuzione) e avvia il server in background. Rimane in esecuzione finché non lo fermi.

Altre lingue

Sono disponibili altri pacchetti linguistici: de, fr, es, ru, nl, sv, it e altri. Per tutte le lingue (download più grande):

docker run -d -p 5500:5500 --name opentts synesthesiam/opentts:all

Avvertenza CJK: OpenTTS funziona meglio con le lingue europee. Il testo in giapponese, cinese e coreano non verrà pronunciato correttamente. Per le lingue CJK, utilizza invece ElevenLabs o Google Cloud.

Passo 3: Configurare En Parlant~

Apri En Parlant~ e vai su Impostazioni (icona dell’ingranaggio) > scheda Audio
Scorri verso il basso fino alla sezione TTS
Imposta Provider TTS su OpenTTS (Self-Hosted)
Verifica che l’URL del server OpenTTS sia http://localhost:5500
Il menu a tendina Voce TTS si popolerà con le voci disponibili. Prova una voce larynx (come harvard) per la migliore qualità
Imposta Text-to-Speech su Attivo
Fai clic sul pulsante Test accanto al selettore della voce

Dovresti sentire una mossa degli scacchi pronunciata ad alta voce.

Guida alla qualità vocale

Le voci provengono da diversi motori inclusi in OpenTTS. Dalla migliore alla più basilare:

Larynx — neurale, dal suono più naturale
Coqui-TTS — neurale, multi-speaker
MaryTTS — basato su Java, qualità discreta
Festival — sintesi tradizionale
eSpeak — robotico ma veloce

Il menu a tendina delle voci mostra il nome del motore tra parentesi, così puoi scegliere di conseguenza.

Gestione del server

Il container OpenTTS viene eseguito in background. Comandi comuni:

# Stop the server
docker stop opentts

# Start it again
docker start opentts

# Remove it entirely
docker rm -f opentts

# Check if it's running
docker ps | grep opentts

Risoluzione dei problemi

Errore “Connection refused”? Il container Docker potrebbe non essere in esecuzione. Esegui docker ps per verificare. Se non è elencato, avvialo con docker start opentts o riesegui il comando docker run del Passo 2.
Nessuna voce nel menu a tendina? Assicurati che il container sia in esecuzione e accessibile all’indirizzo http://localhost:5500. Puoi verificare aprendo quell’URL nel browser — dovresti vedere l’interfaccia web di OpenTTS.
Le voci suonano molto robotiche? Prova a passare a una voce Larynx — sono l’opzione di qualità più alta in OpenTTS. Se desideri una qualità complessiva migliore, considera il passaggio a KittenTTS, Google Cloud o ElevenLabs.