Configuração do OpenTTS

Voltar à Visão Geral dos Fornecedores de TTS

OpenTTS é um servidor TTS de código aberto que funciona no seu próprio computador usando Docker. Sem conta, sem chave de API, sem dados a sair da sua máquina. A configuração demora cerca de 2 minutos se já tiver o Docker instalado.

Nota: O OpenTTS utiliza motores neurais e baseados em regras mais antigos. A qualidade de voz é funcional, mas notoriamente mais robótica do que ElevenLabs, Google Cloud ou KittenTTS. Poderá ser removido numa versão futura se surgirem melhores opções locais.

Passo 1: Instalar o Docker

Se ainda não tem o Docker:

Linux (Ubuntu/Debian): sudo apt install docker.io
Linux (Fedora): sudo dnf install docker
macOS / Windows: Descarregue o Docker Desktop

Passo 2: Iniciar o Servidor OpenTTS

Abra um terminal e execute:

docker run -d -p 5500:5500 --name opentts synesthesiam/opentts:en

Isto descarrega o pacote de vozes em inglês (~1,5 GB na primeira execução) e inicia o servidor em segundo plano. Permanece em execução até que o pare.

Outros Idiomas

Estão disponíveis pacotes de outros idiomas: de, fr, es, ru, nl, sv, it, entre outros. Para todos os idiomas (download maior):

docker run -d -p 5500:5500 --name opentts synesthesiam/opentts:all

Aviso CJK: O OpenTTS funciona melhor com línguas europeias. Texto em japonês, chinês e coreano não será pronunciado corretamente. Para línguas CJK, utilize ElevenLabs ou Google Cloud em alternativa.

Passo 3: Configurar o En Parlant~

Abra o En Parlant~ e aceda a Definições (ícone de engrenagem) > separador Som
Desloque-se para baixo até à secção TTS
Defina Fornecedor de TTS como OpenTTS (Self-Hosted)
Confirme que o URL do Servidor OpenTTS é http://localhost:5500
O menu pendente Voz TTS será preenchido com as vozes disponíveis. Experimente uma voz larynx (como harvard) para a melhor qualidade
Defina Texto-para-Voz como Ligado
Clique no botão Testar junto ao seletor de voz

Deverá ouvir um lance de xadrez pronunciado em voz alta.

Guia de Qualidade de Voz

As vozes provêm de vários motores incluídos no OpenTTS. Da melhor para a mais básica:

Larynx — neural, som mais natural
Coqui-TTS — neural, multi-falante
MaryTTS — baseado em Java, qualidade razoável
Festival — síntese tradicional
eSpeak — robótico mas rápido

O menu pendente de vozes mostra o nome do motor entre parênteses para que possa escolher adequadamente.

Gerir o Servidor

O contentor OpenTTS executa em segundo plano. Comandos comuns:

# Stop the server
docker stop opentts

# Start it again
docker start opentts

# Remove it entirely
docker rm -f opentts

# Check if it's running
docker ps | grep opentts

Resolução de Problemas

Erro “Connection refused”? O contentor Docker pode não estar em execução. Execute docker ps para verificar. Se não estiver listado, inicie-o com docker start opentts ou volte a executar o comando docker run do Passo 2.
Sem vozes no menu pendente? Certifique-se de que o contentor está em execução e acessível em http://localhost:5500. Pode testar abrindo esse URL no seu navegador — deverá ver a interface web do OpenTTS.
As vozes soam muito robóticas? Experimente mudar para uma voz Larynx — são a opção de maior qualidade no OpenTTS. Se pretende melhor qualidade no geral, considere atualizar para KittenTTS, Google Cloud ou ElevenLabs.