Перейти к содержимому

Настройка системного TTS

Вернуться к обзору TTS-провайдеров

Системный TTS использует встроенный синтез речи вашей операционной системы. Устанавливать ничего не нужно — он работает сразу.

Честное предупреждение: системный TTS бесплатен и прост в использовании, и качество соответствующее. На большинстве платформ голос откровенно плохой — роботизированный, невыразительный и порой трудно воспринимаемый при длительных аннотациях. Для быстрого теста, чтобы посмотреть, как работает озвучивание TTS, он вполне подойдёт. Но если вы планируете действительно заниматься с ним, лучше переключиться на буквально любой другой провайдер. Даже бесплатные уровни Google Cloud и ElevenLabs кардинально лучше.

  1. Откройте En Parlant~ и перейдите в Настройки (значок шестерёнки) > вкладка Звук
  2. Установите TTS-провайдер на System (OS Native)
  3. В выпадающем списке голосов отображаются все голоса, доступные в вашей системе
  4. Нажмите кнопку Тест для предварительного прослушивания

Вот и всё. Системный TTS работает сразу, без какой-либо настройки.

Системные голоса существенно различаются в зависимости от операционной системы:

  • macOS — наиболее естественные системные голоса. Новые голоса Apple (например, Samantha Enhanced) весьма хороши.
  • Windows — голоса SAPI достаточно приличные. Windows 10 и более поздние версии включают нейронные голоса, которые звучат лучше классических.
  • Linux — как правило, eSpeak или Festival через speech-dispatcher. Звучат более роботизированно, чем на macOS или Windows, но вполне функциональны.

Если качество кажется вам слишком примитивным, рассмотрите переход на KittenTTS (локальный, бесплатный), Google Cloud или ElevenLabs.

На Linux-системах часто изначально доступны лишь один-два голоса eSpeak. Вы можете добавить больше:

Окно терминала
# Install all eSpeak language data
sudo apt install espeak-ng-data-*
# Install Festival voices
sudo apt install festvox-*
# Install speech-dispatcher voices
sudo apt install speech-dispatcher-*

После установки новых голосов перезапустите En Parlant~, чтобы они появились в выпадающем списке.

Доступные языки зависят от вашей ОС и установленных голосовых пакетов. Системный TTS использует те голоса, которые предоставляет ваша операционная система. Для полноценной многоязычной поддержки используйте ElevenLabs или Google Cloud.

  • Нет голосов в выпадающем списке? На Linux убедитесь, что speech-dispatcher установлен: sudo apt install speech-dispatcher
  • Голос звучит искажённо? Попробуйте выбрать другой голос в выпадающем списке. Некоторые системные голоса работают лучше других.
  • Звука нет вообще? Проверьте настройки звука в системе. Системный TTS использует устройство вывода звука по умолчанию.