Pular para o conteúdo

Configuração do TTS do Sistema

Voltar à Visão Geral dos Fornecedores de TTS

O TTS do Sistema utiliza a síntese de voz integrada do seu sistema operativo. Não é necessário instalar nada — funciona imediatamente.

Um aviso justo: O TTS do Sistema é gratuito e fácil, e a qualidade corresponde ao preço. A qualidade da voz é genuinamente fraca na maioria das plataformas — robótica, monótona e por vezes difícil de acompanhar durante anotações mais longas. Serve perfeitamente para um teste rápido e perceber como funciona a narração por TTS, mas se planeia realmente estudar com este recurso, vai querer mudar para literalmente qualquer outro fornecedor. Mesmo os níveis gratuitos do Google Cloud e do ElevenLabs são dramaticamente melhores.

  1. Abra o En Parlant~ e vá a Definições (ícone de engrenagem) > separador Som
  2. Defina o Fornecedor de TTS como System (OS Native)
  3. O menu suspenso de vozes mostra todas as vozes disponíveis no seu sistema
  4. Clique no botão Testar para pré-visualizar

É tudo. O TTS do Sistema funciona imediatamente sem qualquer configuração.

As vozes do sistema variam significativamente consoante o sistema operativo:

  • macOS — as vozes de sistema mais naturais. As vozes mais recentes da Apple (como Samantha Enhanced) são bastante boas.
  • Windows — as vozes SAPI são razoáveis. O Windows 10+ inclui algumas vozes neurais que soam melhor do que as clássicas.
  • Linux — tipicamente eSpeak ou Festival via speech-dispatcher. Mais robóticas do que no macOS ou Windows, mas funcionais.

Se considerar a qualidade demasiado básica, pondere atualizar para o KittenTTS (local, gratuito), Google Cloud ou ElevenLabs.

Os sistemas Linux frequentemente começam com apenas uma ou duas vozes eSpeak. Pode adicionar mais:

Terminal window
# Install all eSpeak language data
sudo apt install espeak-ng-data-*
# Install Festival voices
sudo apt install festvox-*
# Install speech-dispatcher voices
sudo apt install speech-dispatcher-*

Após instalar novas vozes, reinicie o En Parlant~ para as ver no menu suspenso de vozes.

Os idiomas disponíveis dependem do seu sistema operativo e dos pacotes de vozes instalados. O TTS do Sistema utilizará quaisquer vozes que o seu sistema operativo disponibilize. Para um suporte multilingue abrangente, utilize o ElevenLabs ou o Google Cloud em alternativa.

  • Sem vozes no menu suspenso? No Linux, certifique-se de que o speech-dispatcher está instalado: sudo apt install speech-dispatcher
  • A voz soa distorcida? Experimente uma voz diferente no menu suspenso. Algumas vozes do sistema funcionam melhor do que outras.
  • Sem som de todo? Verifique as definições de áudio do seu sistema. O TTS do Sistema utiliza o dispositivo de saída de áudio predefinido.