Prerrequisitos

Dentro de Genesys Cloud Speech and Text Analytics (STA), la transcripción de voz proporciona el valor de desentrañar el significado de las interacciones, convirtiendo el habla en texto. También libera a los supervisores del centro de contenidos y a los responsables de calidad de tener que escuchar la grabación de una interacción.

La transcripción de la voz sienta las bases para el posterior análisis de la interacción. Por ejemplo, la búsqueda de contenidos, la detección de temas, el análisis de sentimientos, la empatía y el comportamiento poco profesional se basan en el análisis de transcripción. 

La transcripción exacta es necesaria para proporcionar información útil. Las llamadas mal transcritas obligan a un supervisor a escuchar la grabación, en busca de temas que se hayan pasado por alto y de sentimientos que quizá se hayan puntuado incorrectamente. Una mayor precisión mejora todas las capacidades STA. 

La mejora de la precisión de la transcripción ha sido uno de los objetivos desde las primeras funciones de transcripción de Genesys Cloud. Desde su lanzamiento, la transcripción de voz ha experimentado importantes mejoras de precisión en todos los dialectos, incluida la introducción de un nuevo motor de transcripción y modelos de transcripción actualizados.

Comprender la precisión de la transcripción

La precisión de la transcripción de voz suele entenderse mediante la medición de la tasa de error de palabra (WER). La precisión se representa mediante un valor WER negativo (por ejemplo, 100% - WER%). Para más información, consulte Tasa de error de palabra.

Factores que pueden afectar a la precisión de la transcripción

  • Calidad de audio
  • Calidad de grabación
  • Problemas de conectividad
  • Configuración de los servicios de transcripción
  • Motor utilizado para formación y transcripción
  • Datos de entrenamiento utilizados para construir el modelo
  • Vocabulario utilizado en las interacciones

Baja precisión de transcripción

Cuando la precisión de la transcripción es baja, realice los siguientes pasos para asegurarse de que no hay problemas subyacentes que estén afectando negativamente a la transcripción.

  1. Descartar problemas sistémicos.
  2. Revise, transcriba y compare manualmente una muestra de las grabaciones.
  3. Compruebe si hay vocabulario que se transcribe incorrectamente con regularidad.

Después de realizar estos últimos pasos, debe verificar que la configuración es correcta. Las colas y los flujos deben ajustarse al dialecto adecuado para que la transcripción funcione con precisión.

Una vez descartados los problemas de configuración y subyacentes, debes analizar el alcance de los errores de transcripción, recogiendo grabaciones de muestra y comparando las transcripciones generadas con las transcritas manualmente. Para alcanzar un alto nivel de confianza en la precisión de la grabación, este proceso puede requerir aproximadamente dos horas de grabaciones transcritas. Las dos horas de grabaciones transcritas deben estar compuestas por un surtido aleatorio de interacciones y no por una selección de interacciones aparentemente problemáticas.

Para obtener más información sobre la exportación de grabaciones desde Genesys Cloud, consulte Acerca de la integración de acciones masivas de grabación de AWS S3.

El modelo de transcripción de voz a texto se adapta y amplía cuando se agregan frases a un tema. Si hay un término importante ese se malinterpreta constantemente en las transcripciones de interacciones, debe realizar lo siguiente para aumentar la precisión de la transcripción:

  1. Agregar el término para los lista de frases dentro de una nuevo o existente tema.
  2. Verificar los específico el tema se agrega a la lista de temas del programa utilizado para transcribir las interacciones.

 Nota: No añada frases que incluyan palabras mal escritas o que no quiera que se transcriban.

Por ejemplo, si la palabra COVID se transcribe regularmente como encubierta, debería modificar un tema existente o crear un tema nuevo con frases que contienen la palabra covid. Por ejemplo, "Probado para COVID, " "la situación COVID, " "Bloqueos de COVID, " etcétera.

Para más información, ver Trabaja con una frase.

Palabras y frases problemáticas 

A menudo, el problema no reside en la transcripción global, sino que se trata de palabras concretas transcritas de forma inexacta.

La siguiente lista representa los métodos que se pueden llevar a cabo para mejorar las palabras y frases problemáticas.

  • Añadir términos y frases mediante la API de gestión de diccionarios
  • Añadir frases a la definición de temas
  • Uso de los servicios ampliados de transcripción de voz
  • Donación de datos
  • Palabras Descubrimiento

Añadir términos y frases mediante la API de gestión de diccionarios

La gestión de diccionarios permite mejorar el reconocimiento de términos empresariales o específicos de un dominio. Las marcas, palabras o siglas específicas se transcriben en función de las particularidades de la organización. Esta función permite a los clientes añadir términos al diccionario, lo que aumenta la probabilidad de reconocimiento del servicio de transcripción.

Esta función está disponible exclusivamente a través de la API para desarrolladores. para más información, consulte la API de gestión de diccionarios .

Con la API, puede especificar términos específicos de la organización, proporcionar frases de ejemplo, identificar términos que suenen parecido y asignar un aumento de sensibilidad para la transcripción de voz. Los valores Boost van de 1 a 10 y aumentan la probabilidad de identificación del término en una escala logarítmica.

Añadir frases a la definición de temas

La detección de temas permite a las empresas detectar temas específicos en las interacciones. Un tema encapsula una intención de nivel empresarial detectada dentro de las interacciones. Al añadir palabras y frases problemáticas como Tema y asegurarse de que las colas están configuradas correctamente, el cliente puede predisponer el motor de transcripción a identificar estas frases. Para más información, ver Trabaja con un tema.

Uso de los servicios ampliados de transcripción de voz

EVTS utiliza Azure STT para transcribir las interacciones de voz. La transcripción se integra directamente en Genesys Cloud, de modo que la transcripción aparecerá en la página Detalle de las interacciones como cualquier otra transcripción transcrita.

Dependiendo del dialecto que se describa, la precisión de la transcripción puede ser mayor utilizando el EVTS.

Para obtener más información, consulte Transcripción de voz - ¿Cuál es la diferencia entre Genesys Cloud Voice Transcription y Extended Voice Transcription Services.  

Para obtener más información sobre los idiomas compatibles con EVTS, consulte Idiomas compatibles con Genesys Cloud

Donación de datos

Si incluye grabaciones con transcripciones manuales, puede volver a entrenar el motor de transcripción en su lengua materna con la terminología relacionada con la empresa y mejorar así la precisión. Los datos asociados a grabaciones con transcripciones manuales mejoran la precisión global para todos los dialectos. Pueden pasar varios meses hasta que se procesen estos datos y se vuelva a entrenar el modelo dialectal. Una donación de 200 horas o más puede suponer una mejora de la precisión.

Mejoras en la precisión de la hoja de ruta

Genesys actualiza continuamente los modelos acústicos y lingüísticos, así como los motores subyacentes utilizados para la transcripción. De este modo se mejora continuamente la precisión. Para obtener más información sobre una próxima versión de funciones, consulte Feature releases and communication.

Para más preguntas sobre las grabaciones con datos de transcripciones manuales y para mejorar la precisión, , póngase en contacto con el servicio de atención al cliente.