Saltar al contenido principal

Descripción General

Cuando asigna conocimiento a su agente, necesita elegir cómo el agente accede a esa información. itellicoAI ofrece dos métodos de acceso: Modo Contexto (inyección de prompt) y Modo RAG (Generación Aumentada por Recuperación). Comprender la diferencia entre estos enfoques le ayudará a optimizar el rendimiento y la precisión de su agente.

Los Dos Métodos de Acceso

Modo Contexto

Inyección de PromptTodo el conocimiento se inyecta directamente en el contexto de conversación del agente al inicio de cada interacción.Mejor para: Bases de conocimiento pequeñas con información crítica que el agente necesita para cada conversación.

Modo RAG

Generación Aumentada por RecuperaciónEl agente busca y recupera dinámicamente conocimiento relevante basado en el tema de conversación.Mejor para: Bases de conocimiento grandes donde solo se necesitan secciones específicas por conversación.

Modo Contexto (Inyección de Prompt)

Cómo Funciona

En Modo Contexto, el contenido de su base de conocimiento se carga directamente en el prompt del sistema del agente al comienzo de cada conversación:
Prompt del Sistema:
Eres un agente de servicio al cliente útil.

[Instrucciones de su agente...]

==== BASE DE CONOCIMIENTO: Preguntas Frecuentes de Soporte al Cliente ====

### Facturación y Pagos
- Pregunta: ¿Cómo actualizo mi método de pago?
  Respuesta: Puede actualizar su método de pago por...

- Pregunta: ¿Cuándo se me cobrará?
  Respuesta: La facturación ocurre el mismo día de cada mes...

### Política de Devolución
[Contenido completo de política de devolución]

### Información de Envío
[Información completa de envío]

==== FIN DE BASE DE CONOCIMIENTO ====

Ahora asista al cliente con su pregunta.
El agente ve TODO el contenido de conocimiento desde el inicio y puede referenciarlo durante toda la conversación.

Salida Formateada

Por defecto, el conocimiento se inyecta con formato estructurado:
========================================
# Nombre de Base de Conocimiento
Descripción de la base de conocimiento

## Nombre de Carpeta
Descripción de la carpeta

### Título del Elemento
----------------------------------------
Contenido del elemento aquí
----------------------------------------
========================================
Este formato ayuda al agente a entender la estructura y organización del conocimiento.

Cuándo Usar el Modo Contexto

Si su base de conocimiento es compacta, el Modo Contexto asegura que el agente siempre tenga contexto completo.Ejemplo de caso de uso: Un agente de soporte con una base de conocimiento que contiene:
  • 10 preguntas frecuentes comunes
  • Política de devolución (500 palabras)
  • Información de contacto
  • Opciones de envío
Total: ~3,000 palabras - cabe fácilmente en contexto.
Información que el agente debe referenciar en la mayoría o todas las llamadas.Ejemplo de caso de uso: Un agente de reservas que necesita:
  • Políticas de la empresa (siempre)
  • Servicios disponibles (siempre)
  • Estructura de precios (siempre)
  • Procedimientos de reserva (siempre)
Cuando los elementos de conocimiento se referencian entre sí o forman un todo cohesivo.Ejemplo de caso de uso: Agente de configuración de producto con:
  • Dependencias de opciones (“Si eligen X, ofrecer Y”)
  • Matriz de compatibilidad
  • Paquetes de conjunto
  • Precios que dependen de combinaciones

Ventajas del Modo Contexto

Siempre Disponible

El agente tiene acceso inmediato a todo el conocimiento sin retraso de búsqueda

Mejor para Conjuntos Pequeños

Eficiente cuando el conocimiento cabe cómodamente en ventana de contexto

Determinista

El agente ve exactamente el mismo conocimiento cada vez

Funciona con Variables

El conocimiento puede incluir variables Jinja que se resuelven en contexto

Limitaciones del Modo Contexto

El Modo Contexto está limitado a 10,000 tokens en total en todo el conocimiento asignado.
Limitaciones:
  • Mantenga las bases de conocimiento pequeñas (< 1,000 palabras)
  • Todo el conocimiento se envía con cada solicitud (mayor costo)
  • Todo el conocimiento se procesa cada vez (mayor latencia)
  • La base de conocimiento completa se incluye incluso si solo una pequeña porción es relevante

Modo RAG (Generación Aumentada por Recuperación)

Cómo Funciona

En Modo RAG, su base de conocimiento se almacena en una base de datos vectorial. Cuando el agente necesita información:
  1. El usuario hace una pregunta: “¿Cuál es su política de devolución?”
  2. El agente identifica la necesidad: El agente determina que necesita conocimiento sobre devoluciones
  3. El sistema busca: El sistema RAG busca en la base de conocimiento contenido relevante
  4. Se recupera contenido relevante: Solo se obtiene la sección de política de devolución
  5. El agente responde: El agente usa el conocimiento recuperado para responder
El agente solo ve el conocimiento que necesita, cuando lo necesita.

Recuperación Inteligente

RAG usa búsqueda semántica con incrustaciones vectoriales para encontrar conocimiento relevante:
Usuario: "Necesito devolver los zapatos que compré la semana pasada"

El Sistema RAG piensa:
- Palabras clave: "devolver", "zapatos", "compré"
- Significado semántico: Devoluciones, posiblemente intercambio
- Buscar conocimiento sobre: política de devolución, envío, intercambios

Conocimiento recuperado:
- Descripción General de Política de Devolución
- Instrucciones de Envío de Devolución
- Procedimientos de Intercambio

NO recuperado:
- Preguntas Frecuentes de Facturación
- Especificaciones del Producto
- Gestión de Cuenta

Ventajas del Modo RAG

Escala Infinitamente

Soporta bases de conocimiento masivas sin límites de contexto

Más Rápido para Conocimiento Grande

Reduce tokens del prompt del sistema para bases de conocimiento grandes

Eficiente

Solo recupera lo que se necesita para el tema actual

Mejor para Diversidad

Maneja bien una amplia variedad de temas no relacionados

Consideraciones del Modo RAG

RAG depende de la calidad de la incrustación vectorial. Si sus elementos de conocimiento no están claramente escritos, la recuperación puede perder información relevante.
La calidad de recuperación depende de:
  • Títulos de elementos de conocimiento claros y descriptivos
  • Contenido bien estructurado
  • Categorización apropiada en carpetas
  • Evitar información duplicada o conflictiva

Indicador de Tokens de Contexto Restantes

Cuando use el Modo Contexto, monitoree sus tokens de contexto restantes para asegurar que tiene suficiente espacio para conversaciones.

Comprender el Indicador

El panel muestra su uso de contexto en la configuración de Conocimiento:
Configuración de conocimiento mostrando uso de contexto
Configuración de conocimiento mostrando uso de contexto
Puede ver:
  • Modo RAG: Búsqueda vectorial dinámica con tamaño de conocimiento ilimitado
  • Modo Contexto: Agregado al prompt del sistema con un límite de 10,000 tokens

Elegir el Modo Correcto

Use esta guía de decisión para seleccionar el mejor método de acceso:

Enfoque Híbrido

Puede usar ambos modos para diferentes bases de conocimiento en el mismo agente: Ejemplo de configuración:
  • Modo Contexto: Base de conocimiento pequeña de “Políticas Principales” (siempre necesaria)
  • Modo RAG: Base de conocimiento grande de “Catálogo de Productos” (recuperar según sea necesario)
Esto le da lo mejor de ambos mundos.

Probar su Configuración

1

Asignar base de conocimiento

Configure su agente con una base de conocimiento en Modo Contexto o RAG.
2

Iniciar llamada de prueba

Use la función de Llamada de Prueba en el panel.
3

Preguntar sobre contenido de conocimiento

Haga preguntas que deberían ser respondidas desde su base de conocimiento.Preguntas de ejemplo:
  • “¿Cuál es su política de devolución?”
  • “¿Cuánto cuesta el plan Pro?”
  • “¿Cuáles son sus horarios comerciales?”
4

Verificar respuestas

Confirme que el agente está usando correctamente el contenido del conocimiento en las respuestas.
5

Probar casos límite

Pregunte sobre temas NO en su base de conocimiento para asegurar que el agente responda apropiadamente (“No tengo esa información”).

Mejores Prácticas

Cuando tenga duda, use el Modo RAG. Es más seguro para bases de conocimiento grandes y siempre puede cambiar al Modo Contexto si es necesario.
RAG usa búsqueda semántica para encontrar conocimiento relevante. Escriba contenido completo y bien escrito que incluya naturalmente los términos y conceptos que los usuarios preguntarán.Bueno: “Nuestra política de devolución permite devoluciones dentro de 30 días de compra para productos físicos. Los productos digitales no pueden ser devueltos una vez descargados.”Malo: “Ver documento de política” o fragmentos de oraciones incompletos
Pruebe tanto el Modo Contexto como el Modo RAG con su base de conocimiento y vea cuál funciona mejor para su caso de uso.
Use el Modo Contexto para información crítica y frecuentemente necesaria y el Modo RAG para material de referencia extenso.

Solución de Problemas

Verifique:
  • ¿Están todos los elementos de conocimiento en estado COMPLETADO?
  • ¿Es suficiente el contexto restante (no truncado)?
Solución:
  • Corrija elementos fallidos
  • Reduzca el tamaño del conocimiento o cambie a RAG
Verifique:
  • ¿Está bien organizado el contenido?
  • ¿Está haciendo preguntas que coinciden con el conocimiento?
Solución:
  • Agregue contenido más detallado
  • Pruebe con diferentes formulaciones
  • Considere agregar palabras clave al contenido
Verifique:
  • ¿Es correcto y actual el contenido del conocimiento?
  • ¿Tiene información conflictiva en múltiples elementos?
Solución:
  • Actualice el contenido del conocimiento
  • Elimine duplicados y conflictos
Soluciones:
  • Cambie al Modo RAG para bases de conocimiento grandes
  • Divida el conocimiento en bases más pequeñas y enfocadas
  • Reduzca la longitud de las instrucciones del agente
  • Elimine contenido verboso o redundante

Próximos Pasos