Mejorar la precisión de la transcripción

Prerrequisitos

Dentro del análisis de voz y texto (STA) de Genesys Cloud, la transcripción de voz proporciona el valor de desentrañar el significado de las interacciones convirtiendo el habla en texto. STA también libera a los supervisores y responsables de calidad de tener que escuchar la grabación de una interacción.

La transcripción de la voz sienta las bases para el posterior análisis de la interacción. Por ejemplo, la búsqueda de contenidos, la detección de temas, el análisis de sentimientos, la empatía y el comportamiento poco profesional se basan en el análisis de transcripción. 

Una transcripción precisa proporciona información útil. Las llamadas mal transcritas obligan a un supervisor a escuchar la grabación en busca de temas omitidos y de sentimientos que puedan haberse puntuado incorrectamente. Una mayor precisión mejora todas las capacidades STA. 

Comprender la precisión de la transcripción

La precisión de la transcripción de voz suele entenderse mediante la medición de la tasa de error de palabra (WER). La precisión se representa mediante un valor WER negativo (por ejemplo, 100% - WER%). Para más información, consulte Tasa de error de palabra.

Factores que pueden afectar a la precisión de la transcripción

Estos factores afectan a la precisión de la transcripción:

  • Calidad de audio
  • Calidad de grabación
  • Problemas de conectividad
  • Configuración de los servicios de transcripción
  • Motor utilizado para formación y transcripción
  • Datos de entrenamiento utilizados para construir el modelo
  • Vocabulario utilizado en las interacciones

Baja precisión de transcripción

Cuando la precisión de la transcripción sea baja, realice los siguientes pasos para asegurarse de que no existen problemas subyacentes que afecten negativamente a la transcripción.

  1. Descartar problemas sistémicos.
  2. Revise, transcriba y compare manualmente una muestra de las grabaciones.
  3. Compruebe si hay vocabulario que se transcribe incorrectamente con regularidad.

Después de realizar estos pasos, compruebe que la configuración es correcta. Las colas y los flujos deben ajustarse al dialecto adecuado para que la transcripción funcione correctamente.

Después de descartar la configuración y cualquier problema subyacente, analiza el alcance de los errores de transcripción. Para realizar este análisis, recoja grabaciones de muestra y compare las transcripciones generadas con las transcritas manualmente. Para alcanzar un alto nivel de confianza en la precisión de la grabación, este proceso puede requerir aproximadamente dos horas de grabaciones transcritas. Las dos horas de grabaciones transcritas deben incluir un surtido aleatorio de interacciones, en lugar de una selección de interacciones aparentemente problemáticas.

Para obtener más información sobre la exportación de grabaciones desde Genesys Cloud, consulte Acerca de la integración de acciones masivas de grabación de AWS S3.

El modelo de transcripción de voz a texto se adapta y amplía cuando añades frases a un tema. Si existe un término importante que se malinterpreta sistemáticamente en las transcripciones de interacciones, realice los siguientes pasos para aumentar la precisión de la transcripción:

  1. Agregar el término para los lista de frases dentro de una nuevo o existente tema.
  2. Compruebe que el tema específico está añadido a la lista de temas del programa utilizado para transcribir las interacciones.

Nota: No añada frases que incluyan palabras mal escritas o palabras que no desee que se transcriban.

Por ejemplo, si la palabra COVID se transcribe regularmente como encubierta, modifique un tema existente o cree un nuevo tema con frases que contengan la palabra COVID. Por ejemplo, "probado para COVID", "la situación COVID", "bloqueos COVID".

Para más información, ver Trabaja con una frase.

Palabras y frases problemáticas 

A menudo, el problema no reside en la transcripción global, sino que se trata de palabras concretas que se transcriben de forma inexacta.

La siguiente lista representa los métodos que puede llevar a cabo para mejorar las palabras y frases problemáticas.

  • Añadir términos y frases mediante la Gestión de diccionarios
  • Añadir frases a la definición de temas
  • Utilizar servicios ampliados de transcripción de voz
  • Donación de datos
  • Words discovery

Añadir términos y frases mediante la gestión de diccionarios

La gestión de diccionarios permite mejorar el reconocimiento de términos empresariales o específicos de un dominio. Las marcas, palabras o siglas específicas se transcriben en función de las particularidades de la organización. Esta función permite a los clientes añadir términos al diccionario, lo que aumenta la probabilidad de reconocimiento del servicio de transcripción. Para obtener más información, consulte Entender la gestión de diccionarios.

Con la gestión de diccionarios, especifique términos específicos de la organización, proporcione frases de ejemplo, identifique términos que suenen parecido y asigne un aumento de sensibilidad para la transcripción de voz. Los valores Boost van de 1 a 10 y aumentan la probabilidad de identificación del término en una escala logarítmica. Los valores Boost sólo están disponibles con la API.

Añadir frases a la definición de temas

La detección de temas permite a las empresas detectar temas específicos en las interacciones. Un tema encapsula una intención a nivel de negocio detectada en las interacciones. Si añade palabras y frases problemáticas como Tema y se asegura de que las colas están configuradas correctamente, puede predisponer el motor de transcripción a identificar estas frases. Para más información, ver Trabaja con un tema.

Utilizar los servicios ampliados de transcripción de voz (EVTS)

EVTS utiliza la integración Azure STT para transcribir las interacciones de voz. La integración se integra directamente en Genesys Cloud para que la transcripción aparezca en la página Detalle de las interacciones como cualquier otra transcripción transcrita.

Dependiendo del dialecto descrito, la precisión de la transcripción puede ser mayor utilizando el EVTS.

Para obtener más información, consulte Transcripción de voz - ¿Cuál es la diferencia entre Genesys Cloud Voice Transcription y Extended Voice Transcription Services. Para obtener más información sobre los idiomas compatibles con EVTS, consulte Idiomas compatibles con Genesys Cloud

Donación de datos

Si incluye grabaciones con transcripciones manuales, puede volver a entrenar el motor de transcripción del idioma anfitrión con terminología relacionada con la empresa y mejorar la precisión. Los datos asociados a grabaciones con transcripciones manuales mejoran la precisión general para todos los dialectos. El procesamiento de estos datos y el reentrenamiento del modelo dialectal pueden llevar varios meses. Una donación de 200 horas o más puede suponer una mejora de la precisión.

Mejoras en la precisión de la hoja de ruta

Genesys actualiza continuamente los modelos acústicos y lingüísticos, así como los motores subyacentes utilizados para la transcripción. Este proceso permite mejorar continuamente la precisión. Para obtener más información sobre una próxima versión de funciones, consulte Feature releases and communication. Para más preguntas sobre las grabaciones con datos de transcripciones manuales y para mejorar la precisión, póngase en contacto con Atención al cliente.