Przejdź do głównej zawartości

Konfiguracja systemowego TTS

Powrót do Przeglądu dostawców TTS

Systemowy TTS wykorzystuje wbudowaną syntezę mowy Twojego systemu operacyjnego. Nie trzeba niczego instalować — działa od razu.

Uczciwe ostrzeżenie: Systemowy TTS jest darmowy i łatwy w użyciu, ale jakość odpowiada cenie. Jakość głosu jest naprawdę słaba na większości platform — robotyczny, płaski dźwięk, który bywa trudny do śledzenia przy dłuższych komentarzach. Nadaje się do szybkiego testu, żeby zobaczyć, jak działa narracja TTS, ale jeśli planujesz faktycznie z nią pracować, lepiej przełączyć się na dosłownie dowolnego innego dostawcę. Nawet darmowe plany Google Cloud i ElevenLabs są dramatycznie lepsze.

  1. Otwórz En Parlant~ i przejdź do Ustawienia (ikona koła zębatego) > zakładka Dźwięk
  2. Ustaw Dostawca TTS na System (OS Native)
  3. Lista rozwijana głosów pokazuje wszystkie głosy dostępne w Twoim systemie
  4. Kliknij przycisk Test, aby odsłuchać podgląd

To wszystko. Systemowy TTS działa od razu bez żadnej konfiguracji.

Jakość głosu w zależności od systemu operacyjnego

Dział zatytułowany „Jakość głosu w zależności od systemu operacyjnego”

Głosy systemowe różnią się znacząco w zależności od systemu operacyjnego:

  • macOS — najbardziej naturalne głosy systemowe. Nowsze głosy Apple (takie jak Samantha Enhanced) są całkiem dobre.
  • Windows — głosy SAPI są przyzwoite. Windows 10+ zawiera kilka neuronowych głosów, które brzmią lepiej niż klasyczne.
  • Linux — zazwyczaj eSpeak lub Festival przez speech-dispatcher. Bardziej robotyczne niż macOS czy Windows, ale funkcjonalne.

Jeśli jakość wydaje Ci się zbyt podstawowa, rozważ przejście na KittenTTS (lokalne, darmowe), Google Cloud lub ElevenLabs.

Systemy Linux często startują z zaledwie jednym lub dwoma głosami eSpeak. Możesz dodać więcej:

Okno terminala
# Install all eSpeak language data
sudo apt install espeak-ng-data-*
# Install Festival voices
sudo apt install festvox-*
# Install speech-dispatcher voices
sudo apt install speech-dispatcher-*

Po zainstalowaniu nowych głosów uruchom ponownie En Parlant~, aby zobaczyć je na liście rozwijanej głosów.

Dostępne języki zależą od Twojego systemu operacyjnego i zainstalowanych pakietów głosowych. Systemowy TTS korzysta z głosów udostępnianych przez Twój system operacyjny. Aby uzyskać kompleksową obsługę wielu języków, użyj zamiast tego ElevenLabs lub Google Cloud.

  • Brak głosów na liście rozwijanej? Na Linux upewnij się, że speech-dispatcher jest zainstalowany: sudo apt install speech-dispatcher
  • Głos brzmi zniekształcenie? Wypróbuj inny głos z listy rozwijanej. Niektóre głosy systemowe działają lepiej niż inne.
  • Brak dźwięku? Sprawdź ustawienia audio systemu. Systemowy TTS korzysta z domyślnego urządzenia wyjścia audio.