Skip to content

Наладка сістэмнага TTS

Назад да агляду TTS-правайдараў

Сістэмны TTS выкарыстоўвае ўбудаваны сінтэз маўлення вашай аперацыйнай сістэмы. Нічога ўсталёўваць не трэба — ён працуе адразу.

Сумленнае папярэджанне: сістэмны TTS бясплатны і просты, і вы атрымліваеце тое, за што плаціце. Якасць голасу на большасці платформаў сапраўды кепская — рабатычны, плоскі гук, за якім часам цяжка сачыць падчас доўгіх анатацый. Для хуткага тэсту, каб зразумець, як працуе TTS-агучванне, гэта падыходзіць, але калі вы плануеце сапраўды вучыцца з ім, лепш пераключыцца на літаральна любы іншы правайдар. Нават бясплатныя тарыфы Google Cloud і ElevenLabs значна лепшыя.

  1. Адкрыйце En Parlant~ і перайдзіце ў Налады (значок шасцярні) > укладка Гук
  2. Усталюйце TTS-правайдар на System (OS Native)
  3. У выпадным спісе голасаў адлюстроўваюцца ўсе голасы, даступныя ў вашай сістэме
  4. Націсніце кнопку Тэст, каб праслухаць

Вось і ўсё. Сістэмны TTS працуе адразу без аніякай наладкі.

Якасць голасу ў залежнасці ад АС

Section titled “Якасць голасу ў залежнасці ад АС”

Сістэмныя голасы істотна адрозніваюцца ў залежнасці ад аперацыйнай сістэмы:

  • macOS — найбольш натуральныя сістэмныя голасы. Навейшыя голасы Apple (напрыклад, Samantha Enhanced) даволі добрыя.
  • Windows — голасы SAPI прыстойныя. Windows 10+ уключае некаторыя нейронныя голасы, якія гучаць лепш за класічныя.
  • Linux — звычайна eSpeak або Festival праз speech-dispatcher. Больш рабатычныя, чым на macOS ці Windows, але функцыянальныя.

Калі якасць здаецца вам занадта простай, разгледзьце пераход на KittenTTS (лакальны, бясплатны), Google Cloud або ElevenLabs.

Усталяванне дадатковых голасаў на Linux

Section titled “Усталяванне дадатковых голасаў на Linux”

Сістэмы Linux часта пачынаюць толькі з аднаго-двух голасаў eSpeak. Вы можаце дадаць больш:

Terminal window
# Install all eSpeak language data
sudo apt install espeak-ng-data-*
# Install Festival voices
sudo apt install festvox-*
# Install speech-dispatcher voices
sudo apt install speech-dispatcher-*

Пасля ўсталявання новых голасаў перазапусціце En Parlant~, каб яны з’явіліся ў выпадным спісе голасаў.

Даступныя мовы залежаць ад вашай АС і ўсталяваных моўных пакетаў. Сістэмны TTS выкарыстоўвае тыя голасы, якія прадастаўляе ваша аперацыйная сістэма. Для паўнавартаснай шматмоўнай падтрымкі выкарыстоўвайце замест гэтага ElevenLabs або Google Cloud.

  • Няма голасаў у выпадным спісе? На Linux пераканайцеся, што speech-dispatcher усталяваны: sudo apt install speech-dispatcher
  • Голас гучыць скажона? Паспрабуйце іншы голас з выпаднага спісу. Некаторыя сістэмныя голасы працуюць лепш за іншыя.
  • Гуку няма наогул? Праверце налады гуку вашай сістэмы. Сістэмны TTS выкарыстоўвае прыладу вываду гуку па змаўчанні.