Pular para o conteúdo

Configuração do OpenTTS

Voltar à Visão Geral dos Fornecedores de TTS

OpenTTS é um servidor TTS de código aberto que funciona no seu próprio computador usando Docker. Sem conta, sem chave de API, sem dados a sair da sua máquina. A configuração demora cerca de 2 minutos se já tiver o Docker instalado.

Nota: O OpenTTS utiliza motores neurais e baseados em regras mais antigos. A qualidade de voz é funcional, mas notoriamente mais robótica do que ElevenLabs, Google Cloud ou KittenTTS. Poderá ser removido numa versão futura se surgirem melhores opções locais.

Se ainda não tem o Docker:

  • Linux (Ubuntu/Debian): sudo apt install docker.io
  • Linux (Fedora): sudo dnf install docker
  • macOS / Windows: Descarregue o Docker Desktop

Abra um terminal e execute:

Terminal window
docker run -d -p 5500:5500 --name opentts synesthesiam/opentts:en

Isto descarrega o pacote de vozes em inglês (~1,5 GB na primeira execução) e inicia o servidor em segundo plano. Permanece em execução até que o pare.

Estão disponíveis pacotes de outros idiomas: de, fr, es, ru, nl, sv, it, entre outros. Para todos os idiomas (download maior):

Terminal window
docker run -d -p 5500:5500 --name opentts synesthesiam/opentts:all

Aviso CJK: O OpenTTS funciona melhor com línguas europeias. Texto em japonês, chinês e coreano não será pronunciado corretamente. Para línguas CJK, utilize ElevenLabs ou Google Cloud em alternativa.

  1. Abra o En Parlant~ e aceda a Definições (ícone de engrenagem) > separador Som
  2. Desloque-se para baixo até à secção TTS
  3. Defina Fornecedor de TTS como OpenTTS (Self-Hosted)
  4. Confirme que o URL do Servidor OpenTTS é http://localhost:5500
  5. O menu pendente Voz TTS será preenchido com as vozes disponíveis. Experimente uma voz larynx (como harvard) para a melhor qualidade
  6. Defina Texto-para-Voz como Ligado
  7. Clique no botão Testar junto ao seletor de voz

Deverá ouvir um lance de xadrez pronunciado em voz alta.

As vozes provêm de vários motores incluídos no OpenTTS. Da melhor para a mais básica:

  1. Larynx — neural, som mais natural
  2. Coqui-TTS — neural, multi-falante
  3. MaryTTS — baseado em Java, qualidade razoável
  4. Festival — síntese tradicional
  5. eSpeak — robótico mas rápido

O menu pendente de vozes mostra o nome do motor entre parênteses para que possa escolher adequadamente.

O contentor OpenTTS executa em segundo plano. Comandos comuns:

Terminal window
# Stop the server
docker stop opentts
# Start it again
docker start opentts
# Remove it entirely
docker rm -f opentts
# Check if it's running
docker ps | grep opentts
  • Erro “Connection refused”? O contentor Docker pode não estar em execução. Execute docker ps para verificar. Se não estiver listado, inicie-o com docker start opentts ou volte a executar o comando docker run do Passo 2.
  • Sem vozes no menu pendente? Certifique-se de que o contentor está em execução e acessível em http://localhost:5500. Pode testar abrindo esse URL no seu navegador — deverá ver a interface web do OpenTTS.
  • As vozes soam muito robóticas? Experimente mudar para uma voz Larynx — são a opção de maior qualidade no OpenTTS. Se pretende melhor qualidade no geral, considere atualizar para KittenTTS, Google Cloud ou ElevenLabs.