Konfiguracja systemowego TTS

Powrót do Przeglądu dostawców TTS

Systemowy TTS wykorzystuje wbudowaną syntezę mowy Twojego systemu operacyjnego. Nie trzeba niczego instalować — działa od razu.

Uczciwe ostrzeżenie: Systemowy TTS jest darmowy i łatwy w użyciu, ale jakość odpowiada cenie. Jakość głosu jest naprawdę słaba na większości platform — robotyczny, płaski dźwięk, który bywa trudny do śledzenia przy dłuższych komentarzach. Nadaje się do szybkiego testu, żeby zobaczyć, jak działa narracja TTS, ale jeśli planujesz faktycznie z nią pracować, lepiej przełączyć się na dosłownie dowolnego innego dostawcę. Nawet darmowe plany Google Cloud i ElevenLabs są dramatycznie lepsze.

Konfiguracja En Parlant~

Otwórz En Parlant~ i przejdź do Ustawienia (ikona koła zębatego) > zakładka Dźwięk
Ustaw Dostawca TTS na System (OS Native)
Lista rozwijana głosów pokazuje wszystkie głosy dostępne w Twoim systemie
Kliknij przycisk Test, aby odsłuchać podgląd

To wszystko. Systemowy TTS działa od razu bez żadnej konfiguracji.

Jakość głosu w zależności od systemu operacyjnego

Głosy systemowe różnią się znacząco w zależności od systemu operacyjnego:

macOS — najbardziej naturalne głosy systemowe. Nowsze głosy Apple (takie jak Samantha Enhanced) są całkiem dobre.
Windows — głosy SAPI są przyzwoite. Windows 10+ zawiera kilka neuronowych głosów, które brzmią lepiej niż klasyczne.
Linux — zazwyczaj eSpeak lub Festival przez speech-dispatcher. Bardziej robotyczne niż macOS czy Windows, ale funkcjonalne.

Jeśli jakość wydaje Ci się zbyt podstawowa, rozważ przejście na KittenTTS (lokalne, darmowe), Google Cloud lub ElevenLabs.

Instalacja dodatkowych głosów na Linux

Systemy Linux często startują z zaledwie jednym lub dwoma głosami eSpeak. Możesz dodać więcej:

# Install all eSpeak language data
sudo apt install espeak-ng-data-*

# Install Festival voices
sudo apt install festvox-*

# Install speech-dispatcher voices
sudo apt install speech-dispatcher-*

Po zainstalowaniu nowych głosów uruchom ponownie En Parlant~, aby zobaczyć je na liście rozwijanej głosów.

Obsługa języków

Dostępne języki zależą od Twojego systemu operacyjnego i zainstalowanych pakietów głosowych. Systemowy TTS korzysta z głosów udostępnianych przez Twój system operacyjny. Aby uzyskać kompleksową obsługę wielu języków, użyj zamiast tego ElevenLabs lub Google Cloud.

Rozwiązywanie problemów

Brak głosów na liście rozwijanej? Na Linux upewnij się, że speech-dispatcher jest zainstalowany: sudo apt install speech-dispatcher
Głos brzmi zniekształcenie? Wypróbuj inny głos z listy rozwijanej. Niektóre głosy systemowe działają lepiej niż inne.
Brak dźwięku? Sprawdź ustawienia audio systemu. Systemowy TTS korzysta z domyślnego urządzenia wyjścia audio.