Ir al contenido

Configuración de Google Cloud TTS

Volver a la Descripción general de proveedores de TTS

Google Cloud TTS utiliza redes neuronales WaveNet para generar voz con sonido natural. El nivel gratuito es muy generoso: un millón de caracteres por mes. Este tutorial toma aproximadamente 5 minutos.

Una cuenta de Google (la misma que usas para Gmail o YouTube funciona perfectamente). Necesitarás agregar un método de pago, pero no se te cobrará a menos que excedas 1 millón de caracteres en un mes. Eso es muy difícil de lograr con anotaciones de ajedrez.

Paso 1: Iniciar sesión en Google Cloud Console

Sección titulada «Paso 1: Iniciar sesión en Google Cloud Console»
  1. Abre tu navegador y ve a console.cloud.google.com
  2. Inicia sesión con tu cuenta de Google
  3. Si es tu primera vez, Google te pedirá que aceptes los Términos de Servicio. Marca la casilla y haz clic en Agree and Continue

Ahora deberías ver el panel de Google Cloud Console. Se ve cargado — no te preocupes, solo necesitamos dos cosas de aquí.

Google requiere una cuenta de facturación incluso para su nivel gratuito. No se te cobrará por el uso normal de estudio de ajedrez.

  1. En la barra de búsqueda superior, escribe “Billing” y haz clic en Billing en el menú desplegable
  2. Haz clic en Link a billing account (o Create account si aún no tienes una)
  3. Sigue las indicaciones para agregar una tarjeta de crédito o débito
  4. Una vez completado, verás una marca de verificación verde junto a tu cuenta de facturación

Nota: Si ya tienes configurada la facturación de Google Cloud de otro proyecto, puedes omitir este paso. Tu cuenta de facturación existente funciona perfectamente.

Esto le indica a Google qué servicio deseas utilizar.

  1. En la barra de búsqueda superior, escribe “Text-to-Speech”
  2. En los resultados del menú desplegable, haz clic en Cloud Text-to-Speech API (tiene un ícono azul de API)
  3. Llegarás a la página de detalles de la API. Haz clic en el gran botón azul Enable
  4. Espera unos segundos. Cuando el botón cambie a Manage, la API estará habilitada

La clave de API es lo que En Parlant~ utiliza para comunicarse con los servidores de Google.

  1. En la barra de búsqueda superior, escribe “Credentials” y haz clic en Credentials bajo “APIs & Services”
  2. Cerca de la parte superior de la página, haz clic en + Create Credentials
  3. En el menú desplegable, selecciona API key
  4. Aparecerá un cuadro de diálogo mostrando tu nueva clave. Se ve algo así: AIzaSyC...about 35 characters...
  5. Haz clic en el ícono de copiar junto a la clave para copiarla al portapapeles
  6. Haz clic en Close

Después de crear la clave, la verás listada en la página de Credentials. Haz clic en el nombre de la clave para abrir su configuración:

  1. En API restrictions, selecciona Restrict key
  2. Elige Cloud Text-to-Speech API en el menú desplegable
  3. Haz clic en Save

Esto significa que incluso si alguien obtiene tu clave, solo podrá usarla para TTS — nada más.

¡Ya casi terminas!

  1. Abre En Parlant~ y ve a Settings (ícono de engranaje) > pestaña Sound
  2. Desplázate hacia abajo hasta la sección de TTS
  3. Establece TTS Provider en Google Cloud
  4. Haz clic dentro del campo Google Cloud API Key y pega tu clave (Ctrl+V)
  5. Establece Text-to-Speech en On
  6. Haz clic en el botón Test junto al selector de voz

Deberías escuchar un movimiento de ajedrez hablado en voz alta. Si lo escuchas — ¡felicidades, la configuración está completa!

  • ¿La prueba no produce sonido? Verifica que (1) pegaste la clave de API completa, (2) la API de Text-to-Speech está habilitada (Paso 3), y (3) la facturación está vinculada (Paso 2). El problema más común es olvidar habilitar la API.
  • ¿Error “API key not valid”? Asegúrate de haber copiado la clave correctamente — sin espacios adicionales. Si restringiste la clave, verifica que Cloud Text-to-Speech API esté en la lista de APIs permitidas.
  • ¿Error “Billing account not found”? Regresa al Paso 2 y asegúrate de que la facturación esté vinculada a tu proyecto.
  • ¿Las voces suenan diferente a lo esperado? En Parlant~ utiliza voces WaveNet de forma predeterminada. El género de la voz se puede cambiar en Settings > Sound > Google Voice Gender.

El nivel gratuito de Google cubre 1 millón de caracteres por mes de voces WaveNet. Una partida con muchas anotaciones utiliza aproximadamente entre 3,000 y 5,000 caracteres. A ese ritmo, podrías estudiar entre 200 y 300 partidas por mes antes de alcanzar el límite. Google te muestra una advertencia de uso mucho antes de que se aplique cualquier cargo.