OpenTTS 설정
TTS 제공자 개요로 돌아가기
OpenTTS는 Docker를 사용하여 자신의 컴퓨터에서 실행되는 오픈소스 TTS 서버입니다. 계정도, API 키도, 데이터가 외부로 나가는 것도 없습니다. Docker가 이미 설치되어 있다면 설정은 약 2분이면 완료됩니다.
참고: OpenTTS는 구세대 신경망 및 규칙 기반 엔진을 사용합니다. 음성 품질은 기능적이지만 ElevenLabs, Google Cloud, KittenTTS에 비해 눈에 띄게 로봇 같습니다. 더 나은 로컬 옵션이 등장하면 향후 릴리스에서 제거될 수 있습니다.
1단계: Docker 설치
섹션 제목: “1단계: Docker 설치”Docker가 아직 없다면:
- Linux (Ubuntu/Debian):
sudo apt install docker.io - Linux (Fedora):
sudo dnf install docker - macOS / Windows: Docker Desktop 다운로드
2단계: OpenTTS 서버 시작
섹션 제목: “2단계: OpenTTS 서버 시작”터미널을 열고 다음을 실행합니다:
docker run -d -p 5500:5500 --name opentts synesthesiam/opentts:en이 명령어는 영어 음성 팩(최초 실행 시 약 1.5 GB)을 다운로드하고 서버를 백그라운드에서 시작합니다. 중지할 때까지 계속 실행됩니다.
기타 언어
섹션 제목: “기타 언어”다른 언어 팩도 사용 가능합니다: de, fr, es, ru, nl, sv, it 등. 모든 언어를 포함하려면 (더 큰 다운로드):
docker run -d -p 5500:5500 --name opentts synesthesiam/opentts:allCJK 경고: OpenTTS는 유럽 언어에서 가장 잘 작동합니다. 일본어, 중국어, 한국어 텍스트는 올바르게 발음되지 않습니다. CJK 언어의 경우 ElevenLabs 또는 Google Cloud를 대신 사용하세요.
3단계: En Parlant~ 설정
섹션 제목: “3단계: En Parlant~ 설정”- En Parlant~를 열고 설정 (톱니바퀴 아이콘) > 사운드 탭으로 이동합니다
- TTS 섹션까지 아래로 스크롤합니다
- TTS 제공자를 **OpenTTS (Self-Hosted)**로 설정합니다
- OpenTTS Server URL이
http://localhost:5500인지 확인합니다 - TTS Voice 드롭다운에 사용 가능한 음성이 표시됩니다. 최상의 품질을 위해 larynx 음성(예:
harvard)을 시도해 보세요 - Text-to-Speech를 On으로 설정합니다
- 음성 선택기 옆의 테스트 버튼을 클릭합니다
체스 수가 소리로 읽히는 것을 들을 수 있습니다.
음성 품질 가이드
섹션 제목: “음성 품질 가이드”음성은 OpenTTS에 번들된 여러 엔진에서 제공됩니다. 품질이 좋은 순서대로:
- Larynx — 신경망 기반, 가장 자연스러운 소리
- Coqui-TTS — 신경망 기반, 다중 화자
- MaryTTS — Java 기반, 양호한 품질
- Festival — 전통적인 합성
- eSpeak — 로봇 같지만 빠름
음성 드롭다운에 엔진 이름이 괄호 안에 표시되므로 그에 따라 선택할 수 있습니다.
서버 관리
섹션 제목: “서버 관리”OpenTTS 컨테이너는 백그라운드에서 실행됩니다. 주요 명령어:
# 서버 중지docker stop opentts
# 다시 시작docker start opentts
# 완전히 제거docker rm -f opentts
# 실행 중인지 확인docker ps | grep opentts문제 해결
섹션 제목: “문제 해결”- “Connection refused” 오류가 발생하나요? Docker 컨테이너가 실행 중이 아닐 수 있습니다.
docker ps를 실행하여 확인하세요. 목록에 없다면docker start opentts로 시작하거나 2단계의docker run명령어를 다시 실행하세요. - 드롭다운에 음성이 없나요? 컨테이너가 실행 중이고
http://localhost:5500에 접근 가능한지 확인하세요. 브라우저에서 해당 URL을 열어 테스트할 수 있습니다 — OpenTTS 웹 인터페이스가 표시되어야 합니다. - 음성이 매우 로봇 같나요? Larynx 음성으로 전환해 보세요 — OpenTTS에서 가장 높은 품질의 옵션입니다. 전반적으로 더 나은 품질을 원한다면 KittenTTS, Google Cloud, 또는 ElevenLabs로 업그레이드하는 것을 고려하세요.