Documentación

La API de voz de Vocalia.

REST y WebSocket para sintetizar voz en tiempo real. Acentos regionales, streaming de baja latencia y formatos pensados para telefonía y voice agents.

Obtener acceso →

Quickstart

Su primera síntesis de voz.

Autentica con su API key, elige una voz y recibe audio por streaming. Así de simple.

curl

# Sintetizar voz (REST)
curl -X POST https://api.vocalia.ai/v1/tts \
  -H "Authorization: Bearer $VOCALIA_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "voice_id": "ar_valentina",
    "text": "Hola, gracias por comunicarte.",
    "format": "mp3"
  }' --output salida.mp3

python

import requests

r = requests.post(
    "https://api.vocalia.ai/v1/tts",
    headers={"Authorization": f"Bearer {KEY}"},
    json={
        "voice_id": "ar_valentina",
        "text": "Hola, ¿en qué te ayudo?",
        "format": "pcm16",
    },
)

Referencia

Endpoints principales.

Método	Endpoint	Descripción
POST	/v1/tts	Sintetiza voz a partir de texto y devuelve el audio.
WS	/v1/tts/stream	Streaming de audio en tiempo real por WebSocket.
GET	/v1/voices	Lista las voces disponibles por idioma y región.
GET	/v1/usage	Consumo del período actual de su cuenta.

Formatos

Audio

pcm16, mulaw_8000 (telefonía), mp3. Elija según su pipeline.

SDKs

Python · JS

Librerías oficiales para integrar en minutos, además de REST puro.

Auth

API key

Bearer token por proyecto. Genera y revoca keys desde su panel.

Trabajemos juntos

¿Listo para integrar voz?

Pida acceso a la API y le damos las credenciales para arrancar. Si tiene dudas técnicas, escríbanos y le ayudamos con la integración.

Obtener acceso →Ver productos