Наладка OpenTTS
Назад да Агляду TTS-правайдараў
OpenTTS — гэта TTS-сервер з адкрытым зыходным кодам, які працуе на вашым уласным камп’ютары з дапамогай Docker. Не патрабуецца ўліковы запіс, не патрабуецца API-ключ, ніякія даныя не пакідаюць вашу машыну. Наладка займае каля 2 хвілін, калі Docker ужо ўсталяваны.
Заўвага: OpenTTS выкарыстоўвае старэйшыя нейронныя і правілавыя рухавікі. Якасць голасу функцыянальная, але прыкметна больш робатызаваная, чым у ElevenLabs, Google Cloud або KittenTTS. Ён можа быць выдалены ў будучым выпуску, калі з’явяцца лепшыя лакальныя варыянты.
Крок 1: Усталюйце Docker
Section titled “Крок 1: Усталюйце Docker”Калі ў вас яшчэ няма Docker:
- Linux (Ubuntu/Debian):
sudo apt install docker.io - Linux (Fedora):
sudo dnf install docker - macOS / Windows: Спампуйце Docker Desktop
Крок 2: Запусціце сервер OpenTTS
Section titled “Крок 2: Запусціце сервер OpenTTS”Адкрыйце тэрмінал і выканайце:
docker run -d -p 5500:5500 --name opentts synesthesiam/opentts:enГэта спампоўвае англійскі галасавы пакет (~1,5 ГБ пры першым запуску) і запускае сервер у фонавым рэжыме. Ён працуе, пакуль вы яго не спыніце.
Іншыя мовы
Section titled “Іншыя мовы”Даступны пакеты для іншых моў: de, fr, es, ru, nl, sv, it і іншыя. Для ўсіх моў (большы памер спампоўкі):
docker run -d -p 5500:5500 --name opentts synesthesiam/opentts:allПапярэджанне пра CJK: OpenTTS лепш за ўсё працуе з еўрапейскімі мовамі. Японскі, кітайскі і карэйскі тэкст не будзе вымаўляцца правільна. Для CJK-моў выкарыстоўвайце замест гэтага ElevenLabs або Google Cloud.
Крок 3: Наладзьце En Parlant~
Section titled “Крок 3: Наладзьце En Parlant~”- Адкрыйце En Parlant~ і перайдзіце ў Налады (значок шасцярні) > укладка Гук
- Пракруціце ўніз да раздзела TTS
- Усталюйце TTS-правайдар на OpenTTS (Self-Hosted)
- Пацвердзіце, што URL сервера OpenTTS —
http://localhost:5500 - Выпадаючы спіс Голас TTS запоўніцца даступнымі галасамі. Паспрабуйце голас larynx (напрыклад,
harvard) для лепшай якасці - Усталюйце Сінтэз маўлення на Уключана
- Націсніце кнопку Тэст побач з выбарам голасу
Вы павінны пачуць шахматны ход, вымаўлены ўголас.
Даведнік па якасці галасоў
Section titled “Даведнік па якасці галасоў”Галасы паходзяць з некалькіх рухавікоў, уключаных у OpenTTS. Ад лепшага да самага базавага:
- Larynx — нейронны, найбольш натуральнае гучанне
- Coqui-TTS — нейронны, мульцідыктарскі
- MaryTTS — на базе Java, прыстойная якасць
- Festival — традыцыйны сінтэз
- eSpeak — робатызаваны, але хуткі
У выпадаючым спісе галасоў назва рухавіка паказваецца ў дужках, каб вы маглі зрабіць адпаведны выбар.
Кіраванне серверам
Section titled “Кіраванне серверам”Кантэйнер OpenTTS працуе ў фонавым рэжыме. Асноўныя каманды:
# Stop the serverdocker stop opentts
# Start it againdocker start opentts
# Remove it entirelydocker rm -f opentts
# Check if it's runningdocker ps | grep openttsВырашэнне праблем
Section titled “Вырашэнне праблем”- Памылка “Connection refused”? Кантэйнер Docker можа не працаваць. Выканайце
docker ps, каб праверыць. Калі яго няма ў спісе, запусціце яго з дапамогайdocker start openttsабо паўторна выканайце камандуdocker runз кроку 2. - Няма галасоў у выпадаючым спісе? Пераканайцеся, што кантэйнер працуе і даступны па адрасе
http://localhost:5500. Вы можаце праверыць гэта, адкрыўшы гэты URL у браўзеры — вы павінны ўбачыць вэб-інтэрфейс OpenTTS. - Галасы гучаць вельмі робатызавана? Паспрабуйце пераключыцца на голас Larynx — гэта варыянт найвышэйшай якасці ў OpenTTS. Калі вы хочаце лепшую якасць у цэлым, разгледзьце пераход на KittenTTS, Google Cloud або ElevenLabs.