Optimización de los formularios de los supervisores virtuales para la puntuación de la IA

La creación de formularios de evaluación que funcionen bien tanto para la revisión humana como para la de IA ayuda a mejorar la precisión y la coherencia de la puntuación en Genesys Cloud Quality Management. Este artículo describe las mejores prácticas, ejemplos y principios de diseño.

AI Scoring evalúa las conversaciones basándose únicamente en la transcripción y en las preguntas del formulario de evaluación. No tiene en cuenta metadatos como rutas de encaminamiento, marcas de tiempo o datos a nivel de plataforma. Para garantizar resultados precisos, diseñe sus formularios con preguntas claras, mensurables y basadas en transcripciones.

Unos formularios de supervisor virtual bien diseñados hacen que la puntuación de la IA sea más precisa, eficaz y justa. Al centrarse en preguntas mensurables basadas en transcripciones y textos de ayuda concisos, las organizaciones pueden garantizar evaluaciones de IA fiables y reducir el esfuerzo de revisión manual.

Los revisores humanos pueden interpretar el tono, la intención y el contexto más allá de la transcripción. Sin embargo, los modelos de puntuación de IA sólo pueden analizar lo que se dice o se escribe.
Crear formularios adecuados para ambos:

  • Redactar preguntas que se basen únicamente en pruebas textuales.
  • Evite frases emotivas o subjetivas.
  • Utilice una terminología coherente en todo el formulario (por ejemplo, siempre "agente" y "cliente").
  • Proporcione un texto de ayuda claro que defina lo que se considera un "Sí", un "No" o una respuesta específica.

Por ejemplo:
Bien: "¿Saludó el agente al cliente utilizando una frase estándar como 'hola', 'hola' o 'buenos días'?".
? Evítalo: "¿Parecía amable el agente al saludar al cliente?".

Centrarse en pruebas sólo transcritas

Haga sólo preguntas que puedan verificarse mediante texto. Evite el lenguaje basado en el tono o la actitud.

Utilizar estructuras mensurables y binarias

Encuadre las preguntas para que la IA pueda seleccionar Sí/No o una respuesta clara de opción múltiple.

Escribir con frases completas

Evite la taquigrafía o las etiquetas internas. Un lenguaje claro mejora la comprensión del modelo.

Definir límites y ejemplos

Aclarar qué se considera cumplimiento y qué no. Proporcione frases de ejemplo.

Eliminar la subjetividad

Céntrese en las acciones, no en los sentimientos (por ejemplo, "¿Reconoció el agente el problema?" en lugar de "¿Fue empático el agente?").

Incluir ejemplos de texto de ayuda

Añada fragmentos de transcripción para mostrar las respuestas aceptables e inaceptables.

Centrar las preguntas

Cada pregunta debe medir un solo comportamiento.

Utilizar un lenguaje coherente

Normalice la terminología: utilice siempre "agente" y "cliente" en todos los formularios.

Orientar sobre casos extremos

Definir excepciones para que el modelo no malinterprete el cumplimiento parcial.

 Alinear las preguntas con los objetivos empresariales

Cada pregunta debe estar directamente relacionada con la experiencia del cliente, el cumplimiento o los objetivos de eficiencia.

El texto de ayuda proporciona un contexto esencial tanto para los evaluadores de IA como para los humanos.

Al redactar el texto de ayuda:

  • Defina el objetivo de la pregunta y el comportamiento esperado.
  • Describa lo que se considera o No.
  • Incluya ejemplos de frases aceptables e inaceptables.
  • Sea conciso (3-5 frases o ≤500 caracteres).
  • Proporcione breves ejemplos de transcripción para mayor claridad.

Por ejemplo:
Pregunta: ¿Verificó el agente la identidad del cliente antes de prestar asistencia específica a la cuenta?
Texto de ayuda: El agente debe confirmar al menos una credencial (número de cuenta, fecha de nacimiento o número de teléfono).
Sí: El agente solicitó y confirmó una credencial.
No: El agente facilitó información sin verificar la identidad.

Pregunta Tipo de respuesta Ejemplo de texto de ayuda
¿Ha saludado el agente al cliente al inicio de la conversación? Sí / No El agente debe empezar con un saludo estándar como "hola", "hola" o "buenos días".
¿Verificó el agente la identidad del cliente antes de discutir los detalles de la cuenta? Sí / No El agente debe confirmar al menos una credencial (número de cuenta, fecha de nacimiento o número de teléfono).
¿Reconoció el agente el problema del cliente antes de pasar a la resolución? Sí / No El agente debe utilizar frases de reconocimiento como "lo siento", "lo entiendo" o "sé que esto debe ser frustrante".
¿Confirmó el agente la resolución o los siguientes pasos antes de cerrar la conversación? Sí / No El agente debe resumir los pasos siguientes o confirmar que el problema está resuelto.

Error Cuándo se produce Cómo resolver
Error de límite de velocidad Se alcanza el máximo diario de 50 solicitudes de puntuación de IA por agente. Espacie las evaluaciones, evite reintentos innecesarios o solicite un aumento de cuota.
Evaluación por duplicado Se vuelve a presentar el mismo formulario para la misma interacción. Utilice ID de evaluador o formularios diferentes para las segundas revisiones.
Fallo de procesamiento El modelo no puede procesar formatos de pregunta vagos o sin soporte. Simplificar la redacción, utilizar una redacción basada en la transcripción y volver a procesar tras la corrección.
Poca confianza El modelo no puede determinar una respuesta debido a la ambigüedad. Afine las preguntas y añada ejemplos o texto de ayuda aclaratorio.

Mantener la calidad de los formularios y la precisión de la puntuación de la IA:

  • Revisar mensualmente los resultados de la puntuación de la IA para identificar las preguntas de baja confianza.
  • Perfeccione el texto de ayuda o el enunciado de las preguntas en función de la puntuación obtenida.
  • Alinear la formación de los evaluadores humanos con los criterios definidos por la IA.
  • Añada variaciones específicas de dominio (por ejemplo, sanidad, comercio minorista) según sea necesario.