Descripción General
Cuando asigna conocimiento a su agente, necesita elegir cómo el agente accede a esa información. itellicoAI ofrece dos métodos de acceso: Modo Contexto (inyección de prompt) y Modo RAG (Generación Aumentada por Recuperación). Comprender la diferencia entre estos enfoques le ayudará a optimizar el rendimiento y la precisión de su agente.Los Dos Métodos de Acceso
Modo Contexto
Inyección de PromptTodo el conocimiento se inyecta directamente en el contexto de conversación del agente al inicio de cada interacción.Mejor para: Bases de conocimiento pequeñas con información crítica que el agente necesita para cada conversación.
Modo RAG
Generación Aumentada por RecuperaciónEl agente busca y recupera dinámicamente conocimiento relevante basado en el tema de conversación.Mejor para: Bases de conocimiento grandes donde solo se necesitan secciones específicas por conversación.
Modo Contexto (Inyección de Prompt)
Cómo Funciona
En Modo Contexto, el contenido de su base de conocimiento se carga directamente en el prompt del sistema del agente al comienzo de cada conversación:Salida Formateada
Por defecto, el conocimiento se inyecta con formato estructurado:Cuándo Usar el Modo Contexto
Bases de conocimiento pequeñas (< 1,000 palabras)
Bases de conocimiento pequeñas (< 1,000 palabras)
Si su base de conocimiento es compacta, el Modo Contexto asegura que el agente siempre tenga contexto completo.Ejemplo de caso de uso:
Un agente de soporte con una base de conocimiento que contiene:
- 10 preguntas frecuentes comunes
- Política de devolución (500 palabras)
- Información de contacto
- Opciones de envío
Información crítica necesaria cada vez
Información crítica necesaria cada vez
Información que el agente debe referenciar en la mayoría o todas las llamadas.Ejemplo de caso de uso:
Un agente de reservas que necesita:
- Políticas de la empresa (siempre)
- Servicios disponibles (siempre)
- Estructura de precios (siempre)
- Procedimientos de reserva (siempre)
Información altamente estructurada
Información altamente estructurada
Cuando los elementos de conocimiento se referencian entre sí o forman un todo cohesivo.Ejemplo de caso de uso:
Agente de configuración de producto con:
- Dependencias de opciones (“Si eligen X, ofrecer Y”)
- Matriz de compatibilidad
- Paquetes de conjunto
- Precios que dependen de combinaciones
Ventajas del Modo Contexto
Siempre Disponible
El agente tiene acceso inmediato a todo el conocimiento sin retraso de búsqueda
Mejor para Conjuntos Pequeños
Eficiente cuando el conocimiento cabe cómodamente en ventana de contexto
Determinista
El agente ve exactamente el mismo conocimiento cada vez
Funciona con Variables
El conocimiento puede incluir variables Jinja que se resuelven en contexto
Limitaciones del Modo Contexto
Limitaciones:- Mantenga las bases de conocimiento pequeñas (< 1,000 palabras)
- Todo el conocimiento se envía con cada solicitud (mayor costo)
- Todo el conocimiento se procesa cada vez (mayor latencia)
- La base de conocimiento completa se incluye incluso si solo una pequeña porción es relevante
Modo RAG (Generación Aumentada por Recuperación)
Cómo Funciona
En Modo RAG, su base de conocimiento se almacena en una base de datos vectorial. Cuando el agente necesita información:- El usuario hace una pregunta: “¿Cuál es su política de devolución?”
- El agente identifica la necesidad: El agente determina que necesita conocimiento sobre devoluciones
- El sistema busca: El sistema RAG busca en la base de conocimiento contenido relevante
- Se recupera contenido relevante: Solo se obtiene la sección de política de devolución
- El agente responde: El agente usa el conocimiento recuperado para responder
Recuperación Inteligente
RAG usa búsqueda semántica con incrustaciones vectoriales para encontrar conocimiento relevante:Ventajas del Modo RAG
Escala Infinitamente
Soporta bases de conocimiento masivas sin límites de contexto
Más Rápido para Conocimiento Grande
Reduce tokens del prompt del sistema para bases de conocimiento grandes
Eficiente
Solo recupera lo que se necesita para el tema actual
Mejor para Diversidad
Maneja bien una amplia variedad de temas no relacionados
Consideraciones del Modo RAG
RAG depende de la calidad de la incrustación vectorial. Si sus elementos de conocimiento no están claramente escritos, la recuperación puede perder información relevante.
- Títulos de elementos de conocimiento claros y descriptivos
- Contenido bien estructurado
- Categorización apropiada en carpetas
- Evitar información duplicada o conflictiva
Indicador de Tokens de Contexto Restantes
Cuando use el Modo Contexto, monitoree sus tokens de contexto restantes para asegurar que tiene suficiente espacio para conversaciones.Comprender el Indicador
El panel muestra su uso de contexto en la configuración de Conocimiento:

- Modo RAG: Búsqueda vectorial dinámica con tamaño de conocimiento ilimitado
- Modo Contexto: Agregado al prompt del sistema con un límite de 10,000 tokens
Elegir el Modo Correcto
Use esta guía de decisión para seleccionar el mejor método de acceso:Enfoque Híbrido
Puede usar ambos modos para diferentes bases de conocimiento en el mismo agente: Ejemplo de configuración:- Modo Contexto: Base de conocimiento pequeña de “Políticas Principales” (siempre necesaria)
- Modo RAG: Base de conocimiento grande de “Catálogo de Productos” (recuperar según sea necesario)
Probar su Configuración
Asignar base de conocimiento
Configure su agente con una base de conocimiento en Modo Contexto o RAG.
Preguntar sobre contenido de conocimiento
Haga preguntas que deberían ser respondidas desde su base de conocimiento.Preguntas de ejemplo:
- “¿Cuál es su política de devolución?”
- “¿Cuánto cuesta el plan Pro?”
- “¿Cuáles son sus horarios comerciales?”
Verificar respuestas
Confirme que el agente está usando correctamente el contenido del conocimiento en las respuestas.
Mejores Prácticas
Comience con RAG para bases grandes
Comience con RAG para bases grandes
Cuando tenga duda, use el Modo RAG. Es más seguro para bases de conocimiento grandes y siempre puede cambiar al Modo Contexto si es necesario.
Escriba contenido claro y completo
Escriba contenido claro y completo
RAG usa búsqueda semántica para encontrar conocimiento relevante. Escriba contenido completo y bien escrito que incluya naturalmente los términos y conceptos que los usuarios preguntarán.Bueno: “Nuestra política de devolución permite devoluciones dentro de 30 días de compra para productos físicos. Los productos digitales no pueden ser devueltos una vez descargados.”Malo: “Ver documento de política” o fragmentos de oraciones incompletos
Pruebe ambos modos
Pruebe ambos modos
Pruebe tanto el Modo Contexto como el Modo RAG con su base de conocimiento y vea cuál funciona mejor para su caso de uso.
Combine estratégicamente
Combine estratégicamente
Use el Modo Contexto para información crítica y frecuentemente necesaria y el Modo RAG para material de referencia extenso.
Solución de Problemas
El agente no está usando el conocimiento (Modo Contexto)
El agente no está usando el conocimiento (Modo Contexto)
Verifique:
- ¿Están todos los elementos de conocimiento en estado COMPLETADO?
- ¿Es suficiente el contexto restante (no truncado)?
- Corrija elementos fallidos
- Reduzca el tamaño del conocimiento o cambie a RAG
El agente no está encontrando el conocimiento (Modo RAG)
El agente no está encontrando el conocimiento (Modo RAG)
Verifique:
- ¿Está bien organizado el contenido?
- ¿Está haciendo preguntas que coinciden con el conocimiento?
- Agregue contenido más detallado
- Pruebe con diferentes formulaciones
- Considere agregar palabras clave al contenido
El agente proporciona información incorrecta u obsoleta
El agente proporciona información incorrecta u obsoleta
Verifique:
- ¿Es correcto y actual el contenido del conocimiento?
- ¿Tiene información conflictiva en múltiples elementos?
- Actualice el contenido del conocimiento
- Elimine duplicados y conflictos
Uso de contexto demasiado alto
Uso de contexto demasiado alto
Soluciones:
- Cambie al Modo RAG para bases de conocimiento grandes
- Divida el conocimiento en bases más pequeñas y enfocadas
- Reduzca la longitud de las instrucciones del agente
- Elimine contenido verboso o redundante