Comprender los modelos de IA de Genesys Agent Copilot, la entrada LLM y el mapeo de regiones de AWS.

Genesys Agent Copilot utiliza una combinación de modelos nativos de Genesys y AWS Bedrock, en función de la característica, el caso de uso y el dialecto.

Nota: Los tokens del modelo de lenguaje amplio (LLM) no son los mismos que los tokens de Genesys Cloud AI Experience. Para obtener más información sobre los tokens y los precios de Genesys Cloud AI Experience, consulte Medición y precios de los tokens de Genesys Cloud AI Experience.

Visión general de las fichas

Las fichas representan segmentos de texto, como partes de palabras, espacios o signos de puntuación. La API procesa las entradas y las descompone en tokens, que no siempre coinciden con palabras completas. Algunas aproximaciones clave son:

  • Una ficha equivale aproximadamente a cuatro caracteres en inglés
  • Un token equivale aproximadamente a ¾ de palabra
  • 100 fichas equivalen aproximadamente a 75 palabras

 O: 

  • 1-2 frases equivalen aproximadamente a 30 fichas
  • Un párrafo equivale aproximadamente a 100 fichas
  • 1.500 palabras equivalen aproximadamente a 2048 tokens

Por ejemplo, un refrán popular de como "Carpe diem" podría tener 10 fichas. La declaración de la visión de una empresa podría rondar las 500 fichas. Un poema clásico, como "El camino no tomado", puede contener unas 1.700 fichas.

Diferencias lingüísticas

La tokenización varía según el idioma. Por ejemplo, "Bonjour tout le monde", que significa "Hola a todos" en francés, contiene cinco tokens, a pesar de tener sólo 19 caracteres. Los textos que no están en inglés pueden requerir más tokens, lo que repercute en los costes de la API.

Cómo se generan las fichas

La API convierte las palabras en tokens en función de su contexto, los procesa y los vuelve a traducir en texto legible. Una misma palabra puede dividirse en diferentes fichas, dependiendo de su colocación. Por ejemplo, la palabra "azul" podría tener un token diferente si aparece con un espacio al final o empieza con mayúscula.

Ejemplos:

  • El token para "azul" con un espacio al final podría ser "4321".
  • El token para "Azul" (en mayúsculas con un espacio) podría ser "4521".
  • El token para "Azul" (en mayúsculas al principio) podría ser "5000".

Las fichas comunes tienen valores más bajos. Los signos de puntuación, como las comas, tienden a tener un ID de token consistente debido a su uso frecuente. Las palabras pueden tener diferentes ID de token en función de su caso o posición en una frase.