Documentación

La API de voz de Vocalia.

REST y WebSocket para sintetizar voz en tiempo real. Acentos regionales, streaming de baja latencia y formatos pensados para telefonía y voice agents.

Quickstart

Su primera síntesis de voz.

Autentica con su API key, elige una voz y recibe audio por streaming. Así de simple.

curl
# Sintetizar voz (REST)
curl -X POST https://api.vocalia.ai/v1/tts \
  -H "Authorization: Bearer $VOCALIA_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "voice_id": "ar_valentina",
    "text": "Hola, gracias por comunicarte.",
    "format": "mp3"
  }' --output salida.mp3
python
import requests

r = requests.post(
    "https://api.vocalia.ai/v1/tts",
    headers={"Authorization": f"Bearer {KEY}"},
    json={
        "voice_id": "ar_valentina",
        "text": "Hola, ¿en qué te ayudo?",
        "format": "pcm16",
    },
)
Referencia

Endpoints principales.

MétodoEndpointDescripción
POST/v1/ttsSintetiza voz a partir de texto y devuelve el audio.
WS/v1/tts/streamStreaming de audio en tiempo real por WebSocket.
GET/v1/voicesLista las voces disponibles por idioma y región.
GET/v1/usageConsumo del período actual de su cuenta.
Formatos

Audio

pcm16, mulaw_8000 (telefonía), mp3. Elija según su pipeline.

SDKs

Python · JS

Librerías oficiales para integrar en minutos, además de REST puro.

Auth

API key

Bearer token por proyecto. Genera y revoca keys desde su panel.

Trabajemos juntos

¿Listo para integrar voz?

Pida acceso a la API y le damos las credenciales para arrancar. Si tiene dudas técnicas, escríbanos y le ayudamos con la integración.