Mejorar la precisión de la transcripción
- Licencia de Genesys Cloud CX 1 WEM Add-on II, Genesys Cloud CX 2 WEM Add-on I o Genesys Cloud CX 3
- A Genesys Cloud Voice
- La transcripción de voz está activada. Para más información, ver Configurar la transcripción de voz.
Dentro del análisis de voz y texto (STA) de Genesys Cloud, la transcripción de voz proporciona el valor de desentrañar el significado de las interacciones convirtiendo el habla en texto. STA también libera a los supervisores y responsables de calidad de tener que escuchar la grabación de una interacción.
La transcripción de la voz sienta las bases para el posterior análisis de la interacción. Por ejemplo, la búsqueda de contenidos, la detección de temas, el análisis de sentimientos, la empatía y el comportamiento poco profesional se basan en el análisis de transcripción.
Una transcripción precisa proporciona información útil. Las llamadas mal transcritas obligan a un supervisor a escuchar la grabación en busca de temas omitidos y de sentimientos que puedan haberse puntuado incorrectamente. Una mayor precisión mejora todas las capacidades STA.
Comprender la precisión de la transcripción
La precisión de la transcripción de voz suele entenderse mediante la medición de la tasa de error de palabra (WER). La precisión se representa mediante un valor WER negativo (por ejemplo, 100% - WER%). Para más información, consulte Tasa de error de palabra.
Factores que pueden afectar a la precisión de la transcripción
Estos factores afectan a la precisión de la transcripción:
- Calidad de audio
- Calidad de grabación
- Problemas de conectividad
- Configuración de los servicios de transcripción
- Motor utilizado para formación y transcripción
- Datos de entrenamiento utilizados para construir el modelo
- Vocabulario utilizado en las interacciones
Baja precisión de transcripción
Cuando la precisión de la transcripción sea baja, realice los siguientes pasos para asegurarse de que no existen problemas subyacentes que afecten negativamente a la transcripción.
- Descartar problemas sistémicos.
- Revise, transcriba y compare manualmente una muestra de las grabaciones.
- Compruebe si hay vocabulario que se transcribe incorrectamente con regularidad.
Después de realizar estos pasos, compruebe que la configuración es correcta. Las colas y los flujos deben ajustarse al dialecto adecuado para que la transcripción funcione correctamente.
Después de descartar la configuración y cualquier problema subyacente, analiza el alcance de los errores de transcripción. Para realizar este análisis, recoja grabaciones de muestra y compare las transcripciones generadas con las transcritas manualmente. Para alcanzar un alto nivel de confianza en la precisión de la grabación, este proceso puede requerir aproximadamente dos horas de grabaciones transcritas. Las dos horas de grabaciones transcritas deben incluir un surtido aleatorio de interacciones, en lugar de una selección de interacciones aparentemente problemáticas.
Para obtener más información sobre la exportación de grabaciones desde Genesys Cloud, consulte Acerca de la integración de acciones masivas de grabación de AWS S3.
El modelo de transcripción de voz a texto se adapta y amplía cuando añades frases a un tema. Si existe un término importante que se malinterpreta sistemáticamente en las transcripciones de interacciones, realice los siguientes pasos para aumentar la precisión de la transcripción:
- Agregar el término para los lista de frases dentro de una nuevo o existente tema.
- Compruebe que el tema específico está añadido a la lista de temas del programa utilizado para transcribir las interacciones.
Por ejemplo, si la palabra COVID se transcribe regularmente como encubierta, modifique un tema existente o cree un nuevo tema con frases que contengan la palabra COVID. Por ejemplo, "probado para COVID", "la situación COVID", "bloqueos COVID".
Para más información, ver Trabaja con una frase.
Palabras y frases problemáticas
A menudo, el problema no reside en la transcripción global, sino que se trata de palabras concretas que se transcriben de forma inexacta.
La siguiente lista representa los métodos que puede llevar a cabo para mejorar las palabras y frases problemáticas.
- Añadir términos y frases mediante la Gestión de diccionarios
- Añadir frases a la definición de temas
- Utilizar servicios ampliados de transcripción de voz
- Donación de datos
- Words discovery
Añadir términos y frases mediante la gestión de diccionarios
La gestión de diccionarios permite mejorar el reconocimiento de términos empresariales o específicos de un dominio. Las marcas, palabras o siglas específicas se transcriben en función de las particularidades de la organización. Esta función permite a los clientes añadir términos al diccionario, lo que aumenta la probabilidad de reconocimiento del servicio de transcripción. Para obtener más información, consulte Entender la gestión de diccionarios.
Con la gestión de diccionarios, especifique términos específicos de la organización, proporcione frases de ejemplo, identifique términos que suenen parecido y asigne un aumento de sensibilidad para la transcripción de voz. Los valores Boost van de 1 a 10 y aumentan la probabilidad de identificación del término en una escala logarítmica. Los valores Boost sólo están disponibles con la API.
Añadir frases a la definición de temas
La detección de temas permite a las empresas detectar temas específicos en las interacciones. Un tema encapsula una intención a nivel de negocio detectada en las interacciones. Si añade palabras y frases problemáticas como Tema y se asegura de que las colas están configuradas correctamente, puede predisponer el motor de transcripción a identificar estas frases. Para más información, ver Trabaja con un tema.
Utilizar los servicios ampliados de transcripción de voz (EVTS)
EVTS utiliza la integración Azure STT para transcribir las interacciones de voz. La integración se integra directamente en Genesys Cloud para que la transcripción aparezca en la página Detalle de las interacciones como cualquier otra transcripción transcrita.
Dependiendo del dialecto descrito, la precisión de la transcripción puede ser mayor utilizando el EVTS.
Para obtener más información, consulte Transcripción de voz - ¿Cuál es la diferencia entre Genesys Cloud Voice Transcription y Extended Voice Transcription Services. Para obtener más información sobre los idiomas compatibles con EVTS, consulte Idiomas compatibles con Genesys Cloud.
Donación de datos
La donación de grabaciones de centros de contacto puede utilizarse para mejorar la precisión del servicio de transcripción de voz nativa de Genesys. Las grabaciones donadas por los clientes mejoran significativamente la precisión de la transcripción al proporcionar datos de audio del mundo real que captan matices lingüísticos, acentos y patrones del habla únicos.
El proceso implica trabajar directamente con Genesys a través de nuestro proceso de inclusión y recopilación de datos. Estos procesos pueden durar varios meses e implican un flujo de trabajo para garantizar la privacidad y la seguridad. Todas las grabaciones y los metadatos asociados se redactan cuidadosamente para eliminar cualquier información de identificación personal (PII) y términos específicos de la empresa antes de ser utilizados para el entrenamiento del modelo.
Mejoras en la precisión de la hoja de ruta
Genesys actualiza continuamente los modelos acústicos y lingüísticos, así como los motores subyacentes utilizados para la transcripción. Este proceso permite mejorar continuamente la precisión. Para obtener más información sobre una próxima versión de funciones, consulte Feature releases and communication. Para más preguntas sobre las grabaciones con datos de transcripciones manuales y para mejorar la precisión, póngase en contacto con Atención al cliente.