Oppsett av KittenTTS
Tilbake til Oversikt over TTS-leverandører
KittenTTS kjører en nevral TTS-modell direkte på maskinen din. Ingen sky, ingen API-nøkler, ingen data som forlater datamaskinen din — og stemmekvaliteten er genuint god. Oppsettet tar omtrent 5 minutter. Kun engelsk foreløpig.
Maskinvarekrav
Section titled “Maskinvarekrav”KittenTTS bruker PyTorch for nevralnetverksinferens på prosessoren din. Det betyr at det krever reell beregningskraft:
| Maskinvare | Opplevelse |
|---|---|
| 8+ kjerner, moderne CPU (Ryzen 7, i7, Xeon) | Utmerket. Tale genereres raskt, minimal påvirkning på andre oppgaver |
| 4–6 kjerner (Ryzen 5, i5) | Bra. Merkbar CPU-bruk under generering, men fullt brukbart |
| 2 kjerner / eldre CPU | Tregt. Generering kan ta flere sekunder per ytring. Vurder Google Cloud i stedet |
CPU-bruken er midlertidig — KittenTTS bruker kun prosessoren mens tale aktivt genereres (vanligvis 1–2 sekunder per ytring). Mellom ytringer faller CPU-bruken til nær null.
Trådhåndtering
Section titled “Trådhåndtering”Som standard bruker KittenTTS alle tilgjengelige CPU-kjerner for maksimal hastighet. Hvis du også kjører en sjakkmotor (som Stockfish), kan det være lurt å begrense antall tråder KittenTTS bruker.
Under Settings > Sound > KittenTTS CPU Threads kan du sette en verdi for å begrense trådbruken. Sett til 0 for automatisk (bruk alle kjerner). Et godt utgangspunkt for delt bruk med en sjakkmotor er halvparten av antall kjerner.
Tips: KittenTTS og Stockfish vil begge ha CPU-kjerner. Hvis du analyserer på full dybde mens KittenTTS genererer tale, vil begge konkurrere om CPU-tid. På en maskin med 8+ kjerner vil du sjelden merke det. Med 4 kjerner, gi KittenTTS 2 tråder og la resten gå til motoren.
Steg 1: Installer avhengigheter
Section titled “Steg 1: Installer avhengigheter”KittenTTS krever Python 3.10+ og noen Python-pakker. Velg en av disse metodene:
Alternativ A: Veiviser i appen (anbefalt)
Section titled “Alternativ A: Veiviser i appen (anbefalt)”- Åpne En Parlant~ og gå til Settings > Sound
- Sett TTS Provider til KittenTTS (English Only)
- Hvis avhengigheter mangler, vises et gult «Setup Guide»-varsel
- Klikk på varselet for å åpne oppsettveiviseren
- Veiviseren leder deg gjennom hvert steg med «Fix»-knapper for automatisk installasjon
Alternativ B: Oppsettskript i terminalen
Section titled “Alternativ B: Oppsettskript i terminalen”cd /path/to/en-parlant./scripts/setup-tts.sh --kittenttsDette oppretter et virtuelt Python-miljø og installerer de nødvendige pakkene (kittentts, flask, soundfile, numpy). Nano-modellen (~25 MB) lastes ned fra HuggingFace ved første kjøring.
Alternativ C: Manuelt oppsett
Section titled “Alternativ C: Manuelt oppsett”cd /path/to/en-parlant/scriptspython3 -m venv .venv.venv/bin/pip install kittentts flask soundfile numpySteg 2: Konfigurer En Parlant~
Section titled “Steg 2: Konfigurer En Parlant~”- Åpne En Parlant~ og gå til Settings (tannhjulikonet) > Sound-fanen
- Sett TTS Provider til KittenTTS (English Only)
- Serveren starter automatisk når du velger denne leverandøren
- Vent noen sekunder mens modellen lastes (første kjøring laster ned fra HuggingFace)
- Velg en stemme — det finnes 8 alternativer (4 mannlige, 4 kvinnelige)
- Klikk på Test-knappen ved siden av stemmevelgeren
Du skal nå høre et sjakkdrag uttalt med naturlig, uttrykksfull AI-tale.
Feilsøking
Section titled “Feilsøking”- «Server not responding»-feil? KittenTTS-serveren har kanskje ikke startet. Sjekk oppsettveiviseren i Settings — den viser avhengighetsstatus og kan automatisk fikse manglende pakker.
- Første kjøring er treg? Nano-modellen på ~25 MB lastes ned fra HuggingFace ved første bruk. Dette er en engangs nedlasting. Påfølgende oppstarter tar 2–5 sekunder.
- Høy CPU-bruk? Dette er normalt under talegenerering. Reduser antall tråder i Settings hvis det påvirker andre oppgaver.
- Ingen lyd? Sørg for at Python 3.10+ er installert og at det virtuelle miljøet ble opprettet riktig. Oppsettveiviseren kan diagnostisere dette.
Stemmeguide
Section titled “Stemmeguide”KittenTTS tilbyr 8 stemmer nummerert 2–5, hver i mannlig og kvinnelig variant. Alle stemmene er engelske med litt ulike tonekvaliteter. Prøv noen for å finne den du liker best.
Merknad om språk
Section titled “Merknad om språk”KittenTTS støtter foreløpig kun engelsk. For andre språk, bruk ElevenLabs eller Google Cloud. TTS-språkinnstillingen ignoreres når du bruker KittenTTS — sjakktermer uttales alltid på engelsk.