Наладка OpenTTS

Назад да Агляду TTS-правайдараў

OpenTTS — гэта TTS-сервер з адкрытым зыходным кодам, які працуе на вашым уласным камп’ютары з дапамогай Docker. Не патрабуецца ўліковы запіс, не патрабуецца API-ключ, ніякія даныя не пакідаюць вашу машыну. Наладка займае каля 2 хвілін, калі Docker ужо ўсталяваны.

Заўвага: OpenTTS выкарыстоўвае старэйшыя нейронныя і правілавыя рухавікі. Якасць голасу функцыянальная, але прыкметна больш робатызаваная, чым у ElevenLabs, Google Cloud або KittenTTS. Ён можа быць выдалены ў будучым выпуску, калі з’явяцца лепшыя лакальныя варыянты.

Крок 1: Усталюйце Docker

Калі ў вас яшчэ няма Docker:

Linux (Ubuntu/Debian): sudo apt install docker.io
Linux (Fedora): sudo dnf install docker
macOS / Windows: Спампуйце Docker Desktop

Крок 2: Запусціце сервер OpenTTS

Адкрыйце тэрмінал і выканайце:

docker run -d -p 5500:5500 --name opentts synesthesiam/opentts:en

Гэта спампоўвае англійскі галасавы пакет (~1,5 ГБ пры першым запуску) і запускае сервер у фонавым рэжыме. Ён працуе, пакуль вы яго не спыніце.

Іншыя мовы

Даступны пакеты для іншых моў: de, fr, es, ru, nl, sv, it і іншыя. Для ўсіх моў (большы памер спампоўкі):

docker run -d -p 5500:5500 --name opentts synesthesiam/opentts:all

Папярэджанне пра CJK: OpenTTS лепш за ўсё працуе з еўрапейскімі мовамі. Японскі, кітайскі і карэйскі тэкст не будзе вымаўляцца правільна. Для CJK-моў выкарыстоўвайце замест гэтага ElevenLabs або Google Cloud.

Крок 3: Наладзьце En Parlant~

Адкрыйце En Parlant~ і перайдзіце ў Налады (значок шасцярні) > укладка Гук
Пракруціце ўніз да раздзела TTS
Усталюйце TTS-правайдар на OpenTTS (Self-Hosted)
Пацвердзіце, што URL сервера OpenTTS — http://localhost:5500
Выпадаючы спіс Голас TTS запоўніцца даступнымі галасамі. Паспрабуйце голас larynx (напрыклад, harvard) для лепшай якасці
Усталюйце Сінтэз маўлення на Уключана
Націсніце кнопку Тэст побач з выбарам голасу

Вы павінны пачуць шахматны ход, вымаўлены ўголас.

Даведнік па якасці галасоў

Галасы паходзяць з некалькіх рухавікоў, уключаных у OpenTTS. Ад лепшага да самага базавага:

Larynx — нейронны, найбольш натуральнае гучанне
Coqui-TTS — нейронны, мульцідыктарскі
MaryTTS — на базе Java, прыстойная якасць
Festival — традыцыйны сінтэз
eSpeak — робатызаваны, але хуткі

У выпадаючым спісе галасоў назва рухавіка паказваецца ў дужках, каб вы маглі зрабіць адпаведны выбар.

Кіраванне серверам

Кантэйнер OpenTTS працуе ў фонавым рэжыме. Асноўныя каманды:

# Stop the server
docker stop opentts

# Start it again
docker start opentts

# Remove it entirely
docker rm -f opentts

# Check if it's running
docker ps | grep opentts

Вырашэнне праблем

Памылка “Connection refused”? Кантэйнер Docker можа не працаваць. Выканайце docker ps, каб праверыць. Калі яго няма ў спісе, запусціце яго з дапамогай docker start opentts або паўторна выканайце каманду docker run з кроку 2.
Няма галасоў у выпадаючым спісе? Пераканайцеся, што кантэйнер працуе і даступны па адрасе http://localhost:5500. Вы можаце праверыць гэта, адкрыўшы гэты URL у браўзеры — вы павінны ўбачыць вэб-інтэрфейс OpenTTS.
Галасы гучаць вельмі робатызавана? Паспрабуйце пераключыцца на голас Larynx — гэта варыянт найвышэйшай якасці ў OpenTTS. Калі вы хочаце лепшую якасць у цэлым, разгледзьце пераход на KittenTTS, Google Cloud або ElevenLabs.