Descripción General
itellicoAI admite tres tipos de elementos de conocimiento, cada uno diseñado para diferentes fuentes de contenido y casos de uso. Comprender cómo funciona cada tipo y cómo se procesan le ayudará a elegir el formato correcto para su información.Descripción General del Tipo de Contenido
Elementos de Texto
Entrada de contenido directo usando el editor integrado
Cargas de Archivos
Cargue PDF, DOC, DOCX, TXT y otros formatos de documento hasta 10MB
Raspado de URL
Extraiga contenido de páginas web
Elementos de Texto
¿Qué son los Elementos de Texto?
Los elementos de texto son contenido que ingresa directamente en el editor de base de conocimiento de itellicoAI. Son el tipo de contenido más directo y confiable.Cuándo Usar Elementos de Texto
Escribir preguntas frecuentes
Escribir preguntas frecuentes
Cree pares de preguntas y respuestas directamente en el sistema.Ejemplo:
Crear resúmenes de políticas
Crear resúmenes de políticas
Escriba declaraciones de políticas claras y concisas.Ejemplo:
Documentar procedimientos
Documentar procedimientos
Instrucciones paso a paso para procesos.Ejemplo:
Información de referencia rápida
Información de referencia rápida
Información breve y frecuentemente referenciada.Ejemplo:
Crear Elementos de Texto
Escriba el contenido
Ingrese su contenido en el editor. Use formato para claridad:
- Encabezados para secciones
- Viñetas para listas
- Números para pasos
- Negrita para énfasis
Ejemplo JSON de Elemento de Texto
Ventajas de los Elementos de Texto
Procesamiento Instantáneo
Los elementos de texto están disponibles inmediatamente - sin retraso de procesamiento
Control Total
Control completo sobre formato y estructura de contenido
Actualizaciones Fáciles
Rápido de editar y actualizar cuando la información cambia
Confiable
Sin errores de procesamiento o problemas de extracción
Elementos de Carga de Archivos
¿Qué son los Elementos de Carga de Archivos?
Los elementos de carga de archivos le permiten cargar documentos existentes en varios formatos. El sistema extrae el contenido de texto y lo hace disponible para sus agentes.Cuándo Usar Cargas de Archivos
Documentación existente
Documentación existente
Ya tiene contenido en formato de documento.Ejemplos:
- Manuales de usuario
- Especificaciones de productos
- Documentos legales
- Materiales de capacitación
Documentos formateados
Documentos formateados
Documentos con diseños específicos que son más fáciles de mantener como archivos.Ejemplos:
- Diagramas técnicos
- Tablas y gráficos
- Diseños de múltiples columnas
- Plantillas con marca
Documentos de terceros
Documentos de terceros
Documentación que recibe de proveedores o socios.Ejemplos:
- Catálogos de proveedores
- Documentos de cumplimiento
- Materiales de certificación
Requisitos de Archivos
Especificaciones de archivos:- Formatos: PDF, DOC, DOCX, TXT y otros formatos de documento
- Límite de tamaño: Máximo 10MB
- Contenido: Documentos basados en texto e imágenes escaneadas (el análisis avanzado maneja la mayoría de los escaneos)
- Protección: Sin protección de contraseña
El sistema usa análisis avanzado de documentos para extraer texto de imágenes escaneadas y PDFs. La mayoría de los documentos escaneados se procesarán correctamente, aunque escaneos de muy mala calidad pueden requerir entrada manual de texto.
Crear Elementos de Archivo
Ejemplo JSON de Elemento de Archivo
Tiempo de Procesamiento
El tiempo de procesamiento de archivos varía según:- Tamaño del archivo: Archivos más grandes toman más tiempo
- Conteo de páginas: Más páginas = procesamiento más largo
- Complejidad: Tablas, imágenes y diseños complejos ralentizan el procesamiento
- Calidad del texto: Texto limpio y simple se extrae más rápido
- Archivos pequeños (< 1MB, 10 páginas): 10-30 segundos
- Archivos medianos (1-5MB, 10-50 páginas): 30-90 segundos
- Archivos grandes (5-10MB, 50+ páginas): 2-5 minutos
Problemas Comunes con Archivos
Procesamiento fallido
Procesamiento fallido
Causas:
- El archivo excede 10MB
- El archivo está protegido con contraseña
- El archivo está corrupto
- Imágenes escaneadas de muy mala calidad
- Comprima el archivo o divídalo en archivos más pequeños
- Elimine la protección de contraseña
- Re-exporte el archivo desde la fuente
- Para escaneos de muy mala calidad, copie el contenido en un elemento de texto en su lugar
Contenido extraído incorrectamente
Contenido extraído incorrectamente
Causas:
- Diseños complejos (múltiples columnas, tablas)
- Imágenes escaneadas de muy mala calidad
- Fuentes especiales o codificación
- Campos de formulario y elementos interactivos
- Verifique el contenido extraído en modo de edición
- Recree como elemento de texto con formato apropiado
- Simplifique el diseño del documento antes de cargar
- Exporte como documento de texto plano
El procesamiento toma demasiado tiempo
El procesamiento toma demasiado tiempo
Qué hacer:
- Espere 5-10 minutos antes de asumir fallo
- Verifique el tamaño del archivo y conteo de páginas
- Para archivos grandes, considere dividir en múltiples archivos
- Convierta a texto y cargue como elementos de TEXTO en su lugar
Mejores Prácticas de Carga de Archivos
Optimice antes de cargar
- Comprima archivos grandes
- Elimine imágenes innecesarias
- Use documentos basados en texto
- Mantenga bajo 5MB cuando sea posible
Pruebe la extracción
- Revise el contenido extraído después del procesamiento
- Verifique problemas de formato
- Verifique que la información crítica sea precisa
- Vuelva a cargar si la extracción es mala
Elementos de URL
¿Qué son los Elementos de URL?
Los elementos de URL raspan contenido de páginas web y lo almacenan en su base de conocimiento. Esto es útil para referenciar documentación en línea, centros de ayuda o publicaciones de blog.Cuándo Usar Elementos de URL
Documentación pública
Documentación pública
Referencie documentación externa que no mantiene.Ejemplos:
- Documentación de API (propia o de terceros)
- Bases de conocimiento públicas
- Artículos del centro de ayuda
- Páginas de productos
Contenido actualizado frecuentemente
Contenido actualizado frecuentemente
Contenido que cambia regularmente y desea mantener actualizado raspándolo nuevamente.Ejemplos:
- Páginas de precios
- Disponibilidad de productos
- Promociones actuales
- Páginas de estado
Publicaciones de blog o artículos
Publicaciones de blog o artículos
Contenido educativo o anuncios.Ejemplos:
- Guías de cómo hacer
- Artículos de mejores prácticas
- Anuncios de productos
- Tutoriales de características
Crear Elementos de URL
Ejemplo JSON de Elemento de URL
Requisitos de URL
URLs que funcionan:- Públicamente accesibles (sin inicio de sesión requerido)
- Páginas de contenido HTML simple
- Sitios de documentación
- Publicaciones de blog y artículos
- Páginas de contenido estático
- Páginas que requieren autenticación
- Aplicaciones con mucho JavaScript (SPAs)
- Contenido de pago
- Contenido cargado dinámicamente
- Aplicaciones interactivas
El raspado de URL funciona mejor con páginas web simples basadas en texto. Las aplicaciones web complejas pueden no rasparse exitosamente.
Problemas Comunes con URL
Raspado fallido
Raspado fallido
Causas:
- La página requiere inicio de sesión/autenticación
- La URL es incorrecta o está rota
- El contenido se carga vía JavaScript
- El sitio web bloquea el raspado (robots.txt)
- La página no existe (404)
- Verifique que la URL sea públicamente accesible
- Pruebe la URL en ventana de navegador incógnito
- Verifique que la URL esté completa y correcta
- Copie el contenido manualmente en elemento de texto
- Use exportación PDF de la página en su lugar
Contenido incompleto o incorrecto
Contenido incompleto o incorrecto
Causas:
- Contenido renderizado por JavaScript no capturado
- Carga de contenido dinámico
- Múltiples pestañas/secciones en la página
- Comentarios o barra lateral raspados en lugar del contenido principal
- Inspeccione el contenido raspado en modo de edición
- Use URL directa a contenido específico
- Copie el contenido deseado en elemento de texto
- Exporte la página como PDF y cargue en su lugar
El contenido queda obsoleto
El contenido queda obsoleto
Solución:
El contenido de URL se raspa una vez en el momento de creación. Para actualizar:
- Elimine y recree el elemento de URL
- O copie el contenido actual en un elemento de texto para actualizaciones manuales
- Elementos de texto manuales que actualice regularmente
- Exportaciones PDF que actualice periódicamente
Mejores Prácticas de URL
Pruebe la accesibilidad
- Abra la URL en ventana incógnito
- Verifique que no se requiera inicio de sesión
- Verifique que el contenido sea visible
- Asegúrese de que la página cargue rápidamente
Revise el contenido raspado
- Verifique el contenido después del raspado
- Verifique que se capturó el contenido correcto
- Busque problemas de formato
- Confirme que no hay contenido extra (anuncios, barras laterales)
Flujo de Estado de Procesamiento
Los elementos de conocimiento pasan por dos pipelines de procesamiento separados:- Procesamiento de Contenido - Extracción de texto de archivos/URLs
- Indexación Vectorial - Preparación de contenido para RAG (búsqueda semántica)
Estado de Procesamiento de Contenido
Esto rastrea la extracción de contenido de texto de su fuente.PENDIENTE
Significado: Elemento creado, en cola para extracción de contenidoQué está sucediendo:
- El elemento ha sido guardado en la base de datos
- Esperando que el trabajador de procesamiento lo recoja
- Usualmente muy breve (segundos)
PROCESANDO
Significado: El contenido del elemento se está extrayendo ahora mismoQué está sucediendo:
- Para ARCHIVOS: Extrayendo texto de PDF, Word, etc.
- Para URLs: Obteniendo y raspando la página web específica
- Para TEXTO: N/A (salta directamente a COMPLETADO)
COMPLETADO
Significado: La extracción de contenido finalizó exitosamenteQué está sucediendo:
- El contenido ha sido extraído y almacenado
- La indexación vectorial comenzará automáticamente
- El elemento estará disponible una vez que la indexación se complete
FALLIDO
Significado: La extracción de contenido encontró un errorQué está sucediendo:
- La extracción del archivo falló (PDF corrupto, formato no soportado)
- El raspado de URL falló (página no encontrada, bloqueada, requiere autenticación)
- El contenido no está disponible para los agentes
Estado de Indexación Vectorial
Después de que se extrae el contenido, debe ser indexado para RAG (búsqueda semántica). Esto permite a los agentes encontrar conocimiento relevante basado en significado, no solo palabras clave.PENDIENTE
Significado: Esperando que la indexación vectorial comienceQué está sucediendo:
- El procesamiento de contenido se completó exitosamente
- En cola para generación de incrustaciones
- Usualmente breve (segundos a minutos)
INDEXANDO
Significado: Creando incrustaciones vectoriales para RAGQué está sucediendo:
- El contenido se está dividiendo en fragmentos
- Se están generando incrustaciones de IA para cada fragmento
- Los vectores se están almacenando en la base de conocimiento
INDEXADO
Significado: El elemento está completamente listo para recuperación RAGQué está sucediendo:
- Las incrustaciones vectoriales se almacenaron exitosamente
- El elemento puede ser recuperado vía búsqueda semántica
- Los agentes ahora pueden usar este conocimiento
FALLIDO
Significado: La indexación vectorial fallóQué está sucediendo:
- La generación de incrustaciones encontró un error
- El elemento no aparecerá en resultados RAG
- Puede estar disponible solo para inyección de contexto
Ambos estados deben tener éxito para funcionalidad completa:
- Estado de Contenido: COMPLETADO
- Estado Vectorial: INDEXADO
Manejo de Errores
Cuando los Elementos Fallan
Si un elemento de conocimiento muestra estado FALLIDO:Identifique la causa
Causas comunes:
- Archivos: Archivo demasiado grande, corrupto, protegido con contraseña, imagen escaneada
- URL: Autenticación requerida, enlace roto, contenido no accesible
Intente soluciones
- Para Archivos: Comprimir, eliminar protección, agregar capa de texto, o convertir a texto
- Para URLs: Verifique accesibilidad, intente URL diferente, o copie contenido a elemento de texto
Prevenir Errores
Prevención de Archivos
- Mantenga archivos bajo 5MB
- Use documentos basados en texto o escaneos de calidad
- Elimine contraseñas
- Pruebe con archivo pequeño primero
Prevención de URL
- Pruebe URL en modo incógnito
- Use páginas HTML simples
- Evite contenido autenticado
- Verifique compatibilidad robots.txt
Monitoreo del Procesamiento
Indicadores del Panel
En su panel de base de conocimiento, puede ver el estado de procesamiento de un vistazo para cada elemento en sus carpetas: Indicadores de estado:- Marca verde = COMPLETADO
- Reloj de arena = PROCESANDO
- Símbolo de pausa = PENDIENTE
- X roja = FALLIDO
- Manual de Usuario.pdf - COMPLETADO
- Guía de Inicio Rápido.pdf - PROCESANDO
- Documentación de API - PENDIENTE
- Manual Antiguo.pdf - FALLIDO
Procesamiento Masivo
Al cargar múltiples elementos:- Los elementos se procesan secuencialmente o en paralelo (dependiente del sistema)
- Vuelva a verificar después de 5-10 minutos para lotes grandes
- Revise el estado de cada elemento
- Corrija cualquier falla individualmente
Elegir el Tipo de Contenido Correcto
Use este árbol de decisión para seleccionar el mejor tipo de contenido: ¿Tiene contenido existente?- No → Use TEXTO (escriba directamente)
- Sí, es un documento →
- Bajo 10MB → Use ARCHIVO
- Sobre 10MB → Extraiga texto, use TEXTO
- Sí, es una página web →
- Públicamente accesible → Use URL (si el raspado falla, copie a TEXTO)
- No accesible → Copie contenido a TEXTO
Recomendaciones Rápidas
| Su Situación | Mejor Tipo de Contenido |
|---|---|
| Escribir preguntas frecuentes desde cero | TEXTO |
| Tiene documentos Word/PDF existentes | Cargar como ARCHIVO |
| Tiene documentos bajo 10MB | ARCHIVO |
| Tiene documentos sobre 10MB | Dividir en archivos más pequeños o extraer a TEXTO |
| Documentación web pública | URL (con TEXTO como respaldo) |
| Contenido privado/autenticado | Copiar a TEXTO |
| Necesita disponibilidad inmediata | TEXTO (sin retraso de procesamiento) |
| El formato complejo importa | ARCHIVO |
Próximos Pasos
Contexto vs RAG
Aprenda cómo los agentes acceden al contenido de su conocimiento
Crear Bases de Conocimiento
Guía de creación paso a paso
Descripción General de Arquitectura
Comprenda la estructura de la base de conocimiento
Variables y Contenido Dinámico
Referencias de conocimiento en instrucciones del agente