Перейти до вмісту

Налаштування системного TTS

Повернутися до Огляду TTS-провайдерів

Системний TTS використовує вбудований синтез мовлення вашої операційної системи. Нічого не потрібно встановлювати — він працює одразу.

Попередження: Системний TTS безкоштовний і простий у використанні, і якість відповідна. На більшості платформ якість голосу відверто погана — роботизований, монотонний звук, який іноді важко сприймати під час довших анотацій. Для швидкого тесту, щоб побачити, як працює TTS-озвучення, він підійде, але якщо ви плануєте справді навчатися з ним, варто перейти буквально на будь-який інший провайдер. Навіть безкоштовні рівні Google Cloud та ElevenLabs кардинально кращі.

  1. Відкрийте En Parlant~ і перейдіть до Налаштувань (іконка шестерні) > вкладка Звук
  2. Встановіть TTS-провайдер на System (OS Native)
  3. У випадаючому списку голосів відображаються всі голоси, доступні у вашій системі
  4. Натисніть кнопку Тест, щоб прослухати

Ось і все. Системний TTS працює одразу без жодних налаштувань.

Якість голосу залежно від ОС

Section titled “Якість голосу залежно від ОС”

Системні голоси суттєво відрізняються залежно від операційної системи:

  • macOS — найприродніші системні голоси. Новіші голоси Apple (як-от Samantha Enhanced) досить якісні.
  • Windows — голоси SAPI цілком пристойні. Windows 10+ містить деякі нейронні голоси, які звучать краще за класичні.
  • Linux — зазвичай eSpeak або Festival через speech-dispatcher. Більш роботизовані, ніж на macOS чи Windows, але функціональні.

Якщо якість здається занадто базовою, розгляньте перехід на KittenTTS (локальний, безкоштовний), Google Cloud або ElevenLabs.

Встановлення додаткових голосів на Linux

Section titled “Встановлення додаткових голосів на Linux”

Системи Linux часто мають лише один-два голоси eSpeak. Ви можете додати більше:

Terminal window
# Install all eSpeak language data
sudo apt install espeak-ng-data-*
# Install Festival voices
sudo apt install festvox-*
# Install speech-dispatcher voices
sudo apt install speech-dispatcher-*

Після встановлення нових голосів перезапустіть En Parlant~, щоб побачити їх у випадаючому списку голосів.

Доступні мови залежать від вашої ОС та встановлених мовних пакетів. Системний TTS використовує ті голоси, які надає ваша операційна система. Для повноцінної багатомовної підтримки використовуйте натомість ElevenLabs або Google Cloud.

  • Немає голосів у випадаючому списку? На Linux переконайтеся, що speech-dispatcher встановлено: sudo apt install speech-dispatcher
  • Голос звучить спотворено? Спробуйте інший голос із випадаючого списку. Деякі системні голоси працюють краще за інші.
  • Немає звуку взагалі? Перевірте налаштування звуку вашої системи. Системний TTS використовує пристрій аудіовиводу за замовчуванням.