Настройка системного TTS

Вернуться к обзору TTS-провайдеров

Системный TTS использует встроенный синтез речи вашей операционной системы. Устанавливать ничего не нужно — он работает сразу.

Честное предупреждение: системный TTS бесплатен и прост в использовании, и качество соответствующее. На большинстве платформ голос откровенно плохой — роботизированный, невыразительный и порой трудно воспринимаемый при длительных аннотациях. Для быстрого теста, чтобы посмотреть, как работает озвучивание TTS, он вполне подойдёт. Но если вы планируете действительно заниматься с ним, лучше переключиться на буквально любой другой провайдер. Даже бесплатные уровни Google Cloud и ElevenLabs кардинально лучше.

Настройка En Parlant~

Откройте En Parlant~ и перейдите в Настройки (значок шестерёнки) > вкладка Звук
Установите TTS-провайдер на System (OS Native)
В выпадающем списке голосов отображаются все голоса, доступные в вашей системе
Нажмите кнопку Тест для предварительного прослушивания

Вот и всё. Системный TTS работает сразу, без какой-либо настройки.

Качество голоса в зависимости от ОС

Системные голоса существенно различаются в зависимости от операционной системы:

macOS — наиболее естественные системные голоса. Новые голоса Apple (например, Samantha Enhanced) весьма хороши.
Windows — голоса SAPI достаточно приличные. Windows 10 и более поздние версии включают нейронные голоса, которые звучат лучше классических.
Linux — как правило, eSpeak или Festival через speech-dispatcher. Звучат более роботизированно, чем на macOS или Windows, но вполне функциональны.

Если качество кажется вам слишком примитивным, рассмотрите переход на KittenTTS (локальный, бесплатный), Google Cloud или ElevenLabs.

Установка дополнительных голосов на Linux

На Linux-системах часто изначально доступны лишь один-два голоса eSpeak. Вы можете добавить больше:

# Install all eSpeak language data
sudo apt install espeak-ng-data-*

# Install Festival voices
sudo apt install festvox-*

# Install speech-dispatcher voices
sudo apt install speech-dispatcher-*

После установки новых голосов перезапустите En Parlant~, чтобы они появились в выпадающем списке.

Поддержка языков

Доступные языки зависят от вашей ОС и установленных голосовых пакетов. Системный TTS использует те голоса, которые предоставляет ваша операционная система. Для полноценной многоязычной поддержки используйте ElevenLabs или Google Cloud.

Устранение неполадок

Нет голосов в выпадающем списке? На Linux убедитесь, что speech-dispatcher установлен: sudo apt install speech-dispatcher
Голос звучит искажённо? Попробуйте выбрать другой голос в выпадающем списке. Некоторые системные голоса работают лучше других.
Звука нет вообще? Проверьте настройки звука в системе. Системный TTS использует устройство вывода звука по умолчанию.