Skip to content

Наладка OpenTTS

Назад да Агляду TTS-правайдараў

OpenTTS — гэта TTS-сервер з адкрытым зыходным кодам, які працуе на вашым уласным камп’ютары з дапамогай Docker. Не патрабуецца ўліковы запіс, не патрабуецца API-ключ, ніякія даныя не пакідаюць вашу машыну. Наладка займае каля 2 хвілін, калі Docker ужо ўсталяваны.

Заўвага: OpenTTS выкарыстоўвае старэйшыя нейронныя і правілавыя рухавікі. Якасць голасу функцыянальная, але прыкметна больш робатызаваная, чым у ElevenLabs, Google Cloud або KittenTTS. Ён можа быць выдалены ў будучым выпуску, калі з’явяцца лепшыя лакальныя варыянты.

Калі ў вас яшчэ няма Docker:

  • Linux (Ubuntu/Debian): sudo apt install docker.io
  • Linux (Fedora): sudo dnf install docker
  • macOS / Windows: Спампуйце Docker Desktop

Крок 2: Запусціце сервер OpenTTS

Section titled “Крок 2: Запусціце сервер OpenTTS”

Адкрыйце тэрмінал і выканайце:

Terminal window
docker run -d -p 5500:5500 --name opentts synesthesiam/opentts:en

Гэта спампоўвае англійскі галасавы пакет (~1,5 ГБ пры першым запуску) і запускае сервер у фонавым рэжыме. Ён працуе, пакуль вы яго не спыніце.

Даступны пакеты для іншых моў: de, fr, es, ru, nl, sv, it і іншыя. Для ўсіх моў (большы памер спампоўкі):

Terminal window
docker run -d -p 5500:5500 --name opentts synesthesiam/opentts:all

Папярэджанне пра CJK: OpenTTS лепш за ўсё працуе з еўрапейскімі мовамі. Японскі, кітайскі і карэйскі тэкст не будзе вымаўляцца правільна. Для CJK-моў выкарыстоўвайце замест гэтага ElevenLabs або Google Cloud.

Крок 3: Наладзьце En Parlant~

Section titled “Крок 3: Наладзьце En Parlant~”
  1. Адкрыйце En Parlant~ і перайдзіце ў Налады (значок шасцярні) > укладка Гук
  2. Пракруціце ўніз да раздзела TTS
  3. Усталюйце TTS-правайдар на OpenTTS (Self-Hosted)
  4. Пацвердзіце, што URL сервера OpenTTShttp://localhost:5500
  5. Выпадаючы спіс Голас TTS запоўніцца даступнымі галасамі. Паспрабуйце голас larynx (напрыклад, harvard) для лепшай якасці
  6. Усталюйце Сінтэз маўлення на Уключана
  7. Націсніце кнопку Тэст побач з выбарам голасу

Вы павінны пачуць шахматны ход, вымаўлены ўголас.

Даведнік па якасці галасоў

Section titled “Даведнік па якасці галасоў”

Галасы паходзяць з некалькіх рухавікоў, уключаных у OpenTTS. Ад лепшага да самага базавага:

  1. Larynx — нейронны, найбольш натуральнае гучанне
  2. Coqui-TTS — нейронны, мульцідыктарскі
  3. MaryTTS — на базе Java, прыстойная якасць
  4. Festival — традыцыйны сінтэз
  5. eSpeak — робатызаваны, але хуткі

У выпадаючым спісе галасоў назва рухавіка паказваецца ў дужках, каб вы маглі зрабіць адпаведны выбар.

Кантэйнер OpenTTS працуе ў фонавым рэжыме. Асноўныя каманды:

Terminal window
# Stop the server
docker stop opentts
# Start it again
docker start opentts
# Remove it entirely
docker rm -f opentts
# Check if it's running
docker ps | grep opentts
  • Памылка “Connection refused”? Кантэйнер Docker можа не працаваць. Выканайце docker ps, каб праверыць. Калі яго няма ў спісе, запусціце яго з дапамогай docker start opentts або паўторна выканайце каманду docker run з кроку 2.
  • Няма галасоў у выпадаючым спісе? Пераканайцеся, што кантэйнер працуе і даступны па адрасе http://localhost:5500. Вы можаце праверыць гэта, адкрыўшы гэты URL у браўзеры — вы павінны ўбачыць вэб-інтэрфейс OpenTTS.
  • Галасы гучаць вельмі робатызавана? Паспрабуйце пераключыцца на голас Larynx — гэта варыянт найвышэйшай якасці ў OpenTTS. Калі вы хочаце лепшую якасць у цэлым, разгледзьце пераход на KittenTTS, Google Cloud або ElevenLabs.