REST y WebSocket para sintetizar voz en tiempo real. Acentos regionales, streaming de baja latencia y formatos pensados para telefonía y voice agents.
Autentica con su API key, elige una voz y recibe audio por streaming. Así de simple.
# Sintetizar voz (REST) curl -X POST https://api.vocalia.ai/v1/tts \ -H "Authorization: Bearer $VOCALIA_KEY" \ -H "Content-Type: application/json" \ -d '{ "voice_id": "ar_valentina", "text": "Hola, gracias por comunicarte.", "format": "mp3" }' --output salida.mp3
import requests r = requests.post( "https://api.vocalia.ai/v1/tts", headers={"Authorization": f"Bearer {KEY}"}, json={ "voice_id": "ar_valentina", "text": "Hola, ¿en qué te ayudo?", "format": "pcm16", }, )
| Método | Endpoint | Descripción |
|---|---|---|
| POST | /v1/tts | Sintetiza voz a partir de texto y devuelve el audio. |
| WS | /v1/tts/stream | Streaming de audio en tiempo real por WebSocket. |
| GET | /v1/voices | Lista las voces disponibles por idioma y región. |
| GET | /v1/usage | Consumo del período actual de su cuenta. |
pcm16, mulaw_8000 (telefonía), mp3. Elija según su pipeline.
Librerías oficiales para integrar en minutos, además de REST puro.
Bearer token por proyecto. Genera y revoca keys desde su panel.
Pida acceso a la API y le damos las credenciales para arrancar. Si tiene dudas técnicas, escríbanos y le ayudamos con la integración.