itellicoAI Documentation

Descripción General

Cuando asigna conocimiento a su agente, necesita elegir cómo el agente accede a esa información. itellicoAI ofrece dos métodos de acceso: Modo Contexto (inyección de prompt) y Modo RAG (Generación Aumentada por Recuperación). Comprender la diferencia entre estos enfoques le ayudará a optimizar el rendimiento y la precisión de su agente.

Los Dos Métodos de Acceso

Modo Contexto

Inyección de PromptTodo el conocimiento se inyecta directamente en el contexto de conversación del agente al inicio de cada interacción.Mejor para: Bases de conocimiento pequeñas con información crítica que el agente necesita para cada conversación.

Modo RAG

Generación Aumentada por RecuperaciónEl agente busca y recupera dinámicamente conocimiento relevante basado en el tema de conversación.Mejor para: Bases de conocimiento grandes donde solo se necesitan secciones específicas por conversación.

Modo Contexto (Inyección de Prompt)

Cómo Funciona

En Modo Contexto, el contenido de su base de conocimiento se carga directamente en el prompt del sistema del agente al comienzo de cada conversación:

Prompt del Sistema:
Eres un agente de servicio al cliente útil.

[Instrucciones de su agente...]

==== BASE DE CONOCIMIENTO: Preguntas Frecuentes de Soporte al Cliente ====

### Facturación y Pagos
- Pregunta: ¿Cómo actualizo mi método de pago?
  Respuesta: Puede actualizar su método de pago por...

- Pregunta: ¿Cuándo se me cobrará?
  Respuesta: La facturación ocurre el mismo día de cada mes...

### Política de Devolución
[Contenido completo de política de devolución]

### Información de Envío
[Información completa de envío]

==== FIN DE BASE DE CONOCIMIENTO ====

Ahora asista al cliente con su pregunta.

El agente ve TODO el contenido de conocimiento desde el inicio y puede referenciarlo durante toda la conversación.

Salida Formateada

Por defecto, el conocimiento se inyecta con formato estructurado:

========================================
# Nombre de Base de Conocimiento
Descripción de la base de conocimiento

## Nombre de Carpeta
Descripción de la carpeta

### Título del Elemento
----------------------------------------
Contenido del elemento aquí
----------------------------------------
========================================

Este formato ayuda al agente a entender la estructura y organización del conocimiento.

Cuándo Usar el Modo Contexto

Bases de conocimiento pequeñas (< 1,000 palabras)

Si su base de conocimiento es compacta, el Modo Contexto asegura que el agente siempre tenga contexto completo.Ejemplo de caso de uso: Un agente de soporte con una base de conocimiento que contiene:

10 preguntas frecuentes comunes
Política de devolución (500 palabras)
Información de contacto
Opciones de envío

Total: ~3,000 palabras - cabe fácilmente en contexto.

Información crítica necesaria cada vez

Información que el agente debe referenciar en la mayoría o todas las llamadas.Ejemplo de caso de uso: Un agente de reservas que necesita:

Políticas de la empresa (siempre)
Servicios disponibles (siempre)
Estructura de precios (siempre)
Procedimientos de reserva (siempre)

Información altamente estructurada

Cuando los elementos de conocimiento se referencian entre sí o forman un todo cohesivo.Ejemplo de caso de uso: Agente de configuración de producto con:

Dependencias de opciones (“Si eligen X, ofrecer Y”)
Matriz de compatibilidad
Paquetes de conjunto
Precios que dependen de combinaciones

Ventajas del Modo Contexto

Siempre Disponible

El agente tiene acceso inmediato a todo el conocimiento sin retraso de búsqueda

Mejor para Conjuntos Pequeños

Eficiente cuando el conocimiento cabe cómodamente en ventana de contexto

Determinista

El agente ve exactamente el mismo conocimiento cada vez

Funciona con Variables

El conocimiento puede incluir variables Jinja que se resuelven en contexto

Limitaciones del Modo Contexto

El Modo Contexto está limitado a 10,000 tokens en total en todo el conocimiento asignado.

Limitaciones:

Mantenga las bases de conocimiento pequeñas (< 1,000 palabras)
Todo el conocimiento se envía con cada solicitud (mayor costo)
Todo el conocimiento se procesa cada vez (mayor latencia)
La base de conocimiento completa se incluye incluso si solo una pequeña porción es relevante

Modo RAG (Generación Aumentada por Recuperación)

Cómo Funciona

En Modo RAG, su base de conocimiento se almacena en una base de datos vectorial. Cuando el agente necesita información:

El usuario hace una pregunta: “¿Cuál es su política de devolución?”
El agente identifica la necesidad: El agente determina que necesita conocimiento sobre devoluciones
El sistema busca: El sistema RAG busca en la base de conocimiento contenido relevante
Se recupera contenido relevante: Solo se obtiene la sección de política de devolución
El agente responde: El agente usa el conocimiento recuperado para responder

El agente solo ve el conocimiento que necesita, cuando lo necesita.

Recuperación Inteligente

RAG usa búsqueda semántica con incrustaciones vectoriales para encontrar conocimiento relevante:

Usuario: "Necesito devolver los zapatos que compré la semana pasada"

El Sistema RAG piensa:
- Palabras clave: "devolver", "zapatos", "compré"
- Significado semántico: Devoluciones, posiblemente intercambio
- Buscar conocimiento sobre: política de devolución, envío, intercambios

Conocimiento recuperado:
- Descripción General de Política de Devolución
- Instrucciones de Envío de Devolución
- Procedimientos de Intercambio

NO recuperado:
- Preguntas Frecuentes de Facturación
- Especificaciones del Producto
- Gestión de Cuenta

Ventajas del Modo RAG

Escala Infinitamente

Soporta bases de conocimiento masivas sin límites de contexto

Más Rápido para Conocimiento Grande

Reduce tokens del prompt del sistema para bases de conocimiento grandes

Eficiente

Solo recupera lo que se necesita para el tema actual

Mejor para Diversidad

Maneja bien una amplia variedad de temas no relacionados

Consideraciones del Modo RAG

RAG depende de la calidad de la incrustación vectorial. Si sus elementos de conocimiento no están claramente escritos, la recuperación puede perder información relevante.

La calidad de recuperación depende de:

Títulos de elementos de conocimiento claros y descriptivos
Contenido bien estructurado
Categorización apropiada en carpetas
Evitar información duplicada o conflictiva

Indicador de Tokens de Contexto Restantes

Cuando use el Modo Contexto, monitoree sus tokens de contexto restantes para asegurar que tiene suficiente espacio para conversaciones.

Comprender el Indicador

El panel muestra su uso de contexto en la configuración de Conocimiento:

Configuración de conocimiento mostrando uso de contexto

Puede ver:

Modo RAG: Búsqueda vectorial dinámica con tamaño de conocimiento ilimitado
Modo Contexto: Agregado al prompt del sistema con un límite de 10,000 tokens

Elegir el Modo Correcto

Use esta guía de decisión para seleccionar el mejor método de acceso:

Enfoque Híbrido

Puede usar ambos modos para diferentes bases de conocimiento en el mismo agente: Ejemplo de configuración:

Modo Contexto: Base de conocimiento pequeña de “Políticas Principales” (siempre necesaria)
Modo RAG: Base de conocimiento grande de “Catálogo de Productos” (recuperar según sea necesario)

Esto le da lo mejor de ambos mundos.

Probar su Configuración

Asignar base de conocimiento

Configure su agente con una base de conocimiento en Modo Contexto o RAG.

Iniciar llamada de prueba

Use la función de Llamada de Prueba en el panel.

Preguntar sobre contenido de conocimiento

Haga preguntas que deberían ser respondidas desde su base de conocimiento.Preguntas de ejemplo:

“¿Cuál es su política de devolución?”
“¿Cuánto cuesta el plan Pro?”
“¿Cuáles son sus horarios comerciales?”

Verificar respuestas

Confirme que el agente está usando correctamente el contenido del conocimiento en las respuestas.

Probar casos límite

Pregunte sobre temas NO en su base de conocimiento para asegurar que el agente responda apropiadamente (“No tengo esa información”).

Mejores Prácticas

Comience con RAG para bases grandes

Cuando tenga duda, use el Modo RAG. Es más seguro para bases de conocimiento grandes y siempre puede cambiar al Modo Contexto si es necesario.

Escriba contenido claro y completo

RAG usa búsqueda semántica para encontrar conocimiento relevante. Escriba contenido completo y bien escrito que incluya naturalmente los términos y conceptos que los usuarios preguntarán.Bueno: “Nuestra política de devolución permite devoluciones dentro de 30 días de compra para productos físicos. Los productos digitales no pueden ser devueltos una vez descargados.”Malo: “Ver documento de política” o fragmentos de oraciones incompletos

Pruebe ambos modos

Pruebe tanto el Modo Contexto como el Modo RAG con su base de conocimiento y vea cuál funciona mejor para su caso de uso.

Combine estratégicamente

Use el Modo Contexto para información crítica y frecuentemente necesaria y el Modo RAG para material de referencia extenso.

Solución de Problemas

El agente no está usando el conocimiento (Modo Contexto)

Verifique:

¿Están todos los elementos de conocimiento en estado COMPLETADO?
¿Es suficiente el contexto restante (no truncado)?

Solución:

Corrija elementos fallidos
Reduzca el tamaño del conocimiento o cambie a RAG

El agente no está encontrando el conocimiento (Modo RAG)

Verifique:

¿Está bien organizado el contenido?
¿Está haciendo preguntas que coinciden con el conocimiento?

Solución:

Agregue contenido más detallado
Pruebe con diferentes formulaciones
Considere agregar palabras clave al contenido

El agente proporciona información incorrecta u obsoleta

Verifique:

¿Es correcto y actual el contenido del conocimiento?
¿Tiene información conflictiva en múltiples elementos?

Solución:

Actualice el contenido del conocimiento
Elimine duplicados y conflictos

Uso de contexto demasiado alto

Soluciones:

Cambie al Modo RAG para bases de conocimiento grandes
Divida el conocimiento en bases más pequeñas y enfocadas
Reduzca la longitud de las instrucciones del agente
Elimine contenido verboso o redundante

Próximos Pasos

Crear Bases de Conocimiento

Construya y organice su contenido de conocimiento

Tipos de Contenido

Aprenda sobre elementos de texto, PDF y URL

Variables y Contenido Dinámico

Use referencias de conocimiento en instrucciones

Pruebe su Agente

Pruebe cómo su agente usa el conocimiento

Primeros pasos

Crear

Probar

Lanzar

Optimizar

Cuentas y subcuentas

Red de socios

Legal

​Descripción General

​Los Dos Métodos de Acceso

Modo Contexto

Modo RAG

​Modo Contexto (Inyección de Prompt)

​Cómo Funciona

​Salida Formateada

​Cuándo Usar el Modo Contexto

​Ventajas del Modo Contexto

Siempre Disponible

Mejor para Conjuntos Pequeños

Determinista

Funciona con Variables

​Limitaciones del Modo Contexto

​Modo RAG (Generación Aumentada por Recuperación)

​Cómo Funciona

​Recuperación Inteligente

​Ventajas del Modo RAG

Escala Infinitamente

Más Rápido para Conocimiento Grande

Eficiente

Mejor para Diversidad

​Consideraciones del Modo RAG

​Indicador de Tokens de Contexto Restantes

​Comprender el Indicador

​Elegir el Modo Correcto

​Enfoque Híbrido

​Probar su Configuración

​Mejores Prácticas

​Solución de Problemas

​Próximos Pasos

Crear Bases de Conocimiento

Tipos de Contenido

Variables y Contenido Dinámico

Pruebe su Agente

Descripción General

Los Dos Métodos de Acceso

Modo Contexto (Inyección de Prompt)

Cómo Funciona

Salida Formateada

Cuándo Usar el Modo Contexto

Ventajas del Modo Contexto

Limitaciones del Modo Contexto

Modo RAG (Generación Aumentada por Recuperación)

Cómo Funciona

Recuperación Inteligente

Ventajas del Modo RAG

Consideraciones del Modo RAG

Indicador de Tokens de Contexto Restantes

Comprender el Indicador

Elegir el Modo Correcto

Enfoque Híbrido

Probar su Configuración

Mejores Prácticas

Solución de Problemas

Próximos Pasos