İçeriğe geç

KittenTTS Kurulumu

TTS Sağlayıcıları Genel Bakışına dönün

KittenTTS, sinirsel bir TTS modelini doğrudan bilgisayarınızda çalıştırır. Bulut yok, API anahtarı yok, verileriniz bilgisayarınızdan çıkmıyor — ve ses kalitesi gerçekten iyi. Kurulum yaklaşık 5 dakika sürer. Şimdilik yalnızca İngilizce.

KittenTTS, CPU’nuzda sinir ağı çıkarımı için PyTorch kullanır. Bu, gerçek işlem gücü gerektirdiği anlamına gelir:

DonanımDeneyim
8+ çekirdek, modern CPU (Ryzen 7, i7, Xeon)Mükemmel. Konuşma hızlı üretilir, diğer görevler üzerinde minimum etki
4-6 çekirdek (Ryzen 5, i5)İyi. Üretim sırasında fark edilir CPU kullanımı olur ancak gayet kullanılabilir
2 çekirdek / eski CPUYavaş. Üretim her ifade için birkaç saniye sürebilir. Bunun yerine Google Cloud kullanmayı düşünün

CPU kullanımı geçicidir — KittenTTS yalnızca aktif olarak konuşma üretirken CPU kullanır (genellikle ifade başına 1-2 saniye). İfadeler arasında CPU kullanımı neredeyse sıfıra düşer.

Varsayılan olarak KittenTTS, maksimum hız için tüm mevcut CPU çekirdeklerini kullanır. Aynı zamanda bir satranç motoru (örneğin Stockfish) çalıştırıyorsanız, KittenTTS’nin kullandığı iş parçacığı sayısını sınırlamak isteyebilirsiniz.

Settings > Sound > KittenTTS CPU Threads bölümünde iş parçacığı kullanımını sınırlamak için bir değer ayarlayın. Otomatik mod için (tüm çekirdekleri kullan) 0 olarak ayarlayın. Satranç motoruyla birlikte kullanım için iyi bir başlangıç noktası, çekirdek sayınızın yarısıdır.

İpucu: KittenTTS ve Stockfish her ikisi de CPU çekirdeklerine ihtiyaç duyar. Tam derinlikte analiz yaparken KittenTTS konuşma üretiyorsa, ikisi de CPU zamanı için rekabet edecektir. 8+ çekirdekli bir makinede bunu nadiren fark edersiniz. 4 çekirdekte, KittenTTS’ye 2 iş parçacığı verin ve geri kalanını motora bırakın.

KittenTTS, Python 3.10+ ve birkaç Python paketi gerektirir. Bu yöntemlerden birini seçin:

Seçenek A: Uygulama İçi Kurulum Sihirbazı (Önerilen)

Section titled “Seçenek A: Uygulama İçi Kurulum Sihirbazı (Önerilen)”
  1. En Parlant~ uygulamasını açın ve Settings > Sound bölümüne gidin
  2. TTS Provider ayarını KittenTTS (English Only) olarak değiştirin
  3. Bağımlılıklar eksikse sarı bir “Setup Guide” uyarısı görünür
  4. Kurulum sihirbazını açmak için uyarıya tıklayın
  5. Sihirbaz, otomatik kurulum için “Fix” düğmeleriyle her adımda size rehberlik eder
Terminal window
cd /path/to/en-parlant
./scripts/setup-tts.sh --kittentts

Bu, bir Python sanal ortamı oluşturur ve gerekli paketleri (kittentts, flask, soundfile, numpy) yükler. Nano model (~25MB), ilk çalıştırmada HuggingFace’den indirilir.

Terminal window
cd /path/to/en-parlant/scripts
python3 -m venv .venv
.venv/bin/pip install kittentts flask soundfile numpy
  1. En Parlant~ uygulamasını açın ve Settings (dişli simgesi) > Sound sekmesine gidin
  2. TTS Provider ayarını KittenTTS (English Only) olarak değiştirin
  3. Bu sağlayıcıyı seçtiğinizde sunucu otomatik olarak başlar
  4. Modelin yüklenmesi için birkaç saniye bekleyin (ilk çalıştırmada HuggingFace’den indirilir)
  5. Bir ses seçin — 8 seçenek mevcuttur (4 erkek, 4 kadın)
  6. Ses seçicinin yanındaki Test düğmesine tıklayın

Doğal ve ifadeli yapay zeka konuşmasıyla sesli olarak söylenen bir satranç hamlesi duymalısınız.

  • “Server not responding” hatası mı alıyorsunuz? KittenTTS sunucusu başlamamış olabilir. Settings bölümündeki kurulum sihirbazını kontrol edin — bağımlılık durumunu gösterir ve eksik paketleri otomatik olarak düzeltebilir.
  • İlk çalıştırma yavaş mı? ~25MB nano model ilk kullanımda HuggingFace’den indirilir. Bu tek seferlik bir indirmedir. Sonraki başlatmalar 2-5 saniye sürer.
  • Yüksek CPU kullanımı mı? Bu, konuşma üretimi sırasında normaldir. Diğer görevleri etkiliyorsa Settings bölümünden iş parçacığı sayısını azaltın.
  • Ses yok mu? Python 3.10+ sürümünün yüklü olduğundan ve sanal ortamın başarıyla oluşturulduğundan emin olun. Kurulum sihirbazı bunu teşhis edebilir.

KittenTTS, her biri erkek ve kadın varyantlarında olmak üzere 2-5 arası numaralandırılmış 8 ses sunar. Tüm sesler İngilizce olup hafif farklı ton özelliklerine sahiptir. En beğendiğinizi bulmak için birkaçını deneyin.

KittenTTS şu anda yalnızca İngilizce desteklemektedir. Diğer diller için ElevenLabs veya Google Cloud kullanın. KittenTTS kullanılırken TTS dil ayarı dikkate alınmaz — satranç terimleri her zaman İngilizce olarak söylenir.