Las etiquetas SSML (Speech Synthesis Markup Language) son marcas especiales que se agregan dentro de un texto para indicarle a un sistema de voz sintética cómo debe pronunciarlo.
No modifican lo que se dice, sino la manera en que se dice.
Permiten controlar aspectos como:
Pausas entre frases
Énfasis en palabras importantes
Velocidad y tono de la voz
Forma correcta de leer números, fechas, montos o teléfonos
En resumen, SSML sirve para que una voz artificial suene más natural, clara y profesional, especialmente en asistentes virtuales, IVR y voicebots.
En cualquier tipo de nodo que contenta mensaje en el Voicebot en Audara es posible utilizar etiquetas SSML (Speech Synthesis Markup Language) para controlar la forma en que el motor de voz interpreta y reproduce el texto.
Las etiquetas SSML se muestran en color morado dentro del editor para diferenciarlas claramente del contenido normal del mensaje.
Las variables dinámicas del sistema (como {{CALLERID}}) se muestran en color azul como se puede ver en la imagen.
En la captura se observa el siguiente mensaje:
Tu teléfono
<say-as interpret-as="digits">
{{CALLERID}}
</say-as>
no está registrado en nuestro sistema.
Qué hace esto?
{{CALLERID}} → Variable dinámica que contiene el número del cliente.
<say-as interpret-as="digits"> → Indica al motor de voz que debe leer cada número individualmente.
Sin SSML el sistema podría decir:
tres mil uno millones…
Con SSML dirá:
tres – cero – cero – uno – dos – tres – cuatro…
Lo cual es correcto para lectura de teléfonos.
Sirve para que no suene robótico y atropellado.
<speak>
Tu cita está confirmada.
<break time="500ms"/>
Te esperamos mañana.
</speak>
Se mide en ms y puede ser útil en:
Dar ritmo natural
Separar frases importantes
Evitar que todo suene corrido
Muy útil cuando lees términos legales o números largos.
<prosody rate="slow">
Por favor, escuche con atención.
</prosody>
Puedes hacer que la voz hable:
Más lento (para adultos mayores)
Más rápido (para mensajes informativos cortos)
Funciona para decirle como debe leer algo en particular.
<say-as interpret-as="date">
2026-03-05
</say-as>
Evita que diga:
“dos mil veintiséis guion cero tres guion cero cinco”
Y en su lugar diga:
“cinco de marzo de dos mil veintiséis”
Es la etiqueta mas usada de todas, perfecta para deletrear y decir números dígito por digito.
<say-as interpret-as="characters">
CRM
</say-as> Para que diga:
C – R – M y no “crem”
<say-as interpret-as="telephone">
3001234567
</say-as>
Para que lo lea como teléfono dígito por dígito y no como número entero.
Copyright 2026 © Audara – AudaraDocs