Vue d’ensemble
itellicoAI prend en charge trois types d’éléments de connaissance, chacun conçu pour différentes sources de contenu et cas d’usage. Comprendre comment chaque type fonctionne et comment ils sont traités vous aidera à choisir le bon format pour tes informations.Aperçu des Types de Contenu
Éléments Texte
Saisie directe de contenu à l’aide de l’éditeur intégré
Téléchargements de Fichiers
Télécharger PDF, DOC, DOCX, TXT et autres formats de documents jusqu’à 10 Mo
Extraction URL
Extraire le contenu de pages web
Éléments Texte
Que sont les Éléments Texte ?
Les éléments texte sont du contenu que vous saisissez directement dans l’éditeur de base de connaissances itellicoAI. C’est le type de contenu le plus simple et le plus fiable.Quand Utiliser les Éléments Texte
Rédiger des FAQ
Rédiger des FAQ
Créer des paires question-réponse directement dans le système.Exemple :
Créer des résumés de politique
Créer des résumés de politique
Rédiger des déclarations de politique claires et concises.Exemple :
Documenter les procédures
Documenter les procédures
Instructions étape par étape pour les processus.Exemple :
Informations de référence rapide
Informations de référence rapide
Informations brèves et fréquemment référencées.Exemple :
Créer des Éléments Texte
Rédiger le contenu
Entre ton contenu dans l’éditeur. Utilise le formatage pour la clarté :
- Titres pour les sections
- Points de liste pour les listes
- Numéros pour les étapes
- Gras pour l’emphase
Exemple JSON d’Élément Texte
Avantages des Éléments Texte
Traitement Instantané
Les éléments texte sont immédiatement disponibles - pas de délai de traitement
Contrôle Total
Contrôle complet sur le formatage et la structure du contenu
Mises à Jour Faciles
Rapide à éditer et mettre à jour lorsque les informations changent
Fiable
Pas d’erreurs de traitement ou de problèmes d’extraction
Éléments de Téléchargement de Fichiers
Que sont les Éléments de Téléchargement de Fichiers ?
Les éléments de téléchargement de fichiers te permettent de télécharger des documents existants dans divers formats. Le système extrait le contenu textuel et le rend disponible pour tes agents.Quand Utiliser les Téléchargements de Fichiers
Documentation existante
Documentation existante
Tu as déjà du contenu au format document.Exemples :
- Manuels utilisateur
- Spécifications produit
- Documents légaux
- Supports de formation
Documents formatés
Documents formatés
Documents avec des mises en page spécifiques plus faciles à maintenir sous forme de fichiers.Exemples :
- Diagrammes techniques
- Tableaux et graphiques
- Mises en page multi-colonnes
- Modèles de marque
Documents tiers
Documents tiers
Documentation que tu reçois de fournisseurs ou partenaires.Exemples :
- Catalogues fournisseurs
- Documents de conformité
- Matériels de certification
Exigences de Fichier
Spécifications de fichier :- Formats : PDF, DOC, DOCX, TXT et autres formats de documents
- Limite de taille : 10 Mo maximum
- Contenu : Documents textuels et images numérisées (l’analyse avancée gère la plupart des numérisations)
- Protection : Pas de protection par mot de passe
Le système utilise une analyse avancée de documents pour extraire le texte des images numérisées et des PDF. La plupart des documents numérisés seront traités correctement, bien que les numérisations de très mauvaise qualité puissent nécessiter une saisie manuelle du texte.
Créer des Éléments de Fichier
Exemple JSON d’Élément de Fichier
Temps de Traitement
Le temps de traitement des fichiers varie en fonction de :- Taille du fichier : Les fichiers plus volumineux prennent plus de temps
- Nombre de pages : Plus de pages = traitement plus long
- Complexité : Tableaux, images et mises en page complexes ralentissent le traitement
- Qualité du texte : Le texte propre et simple s’extrait plus rapidement
- Petits fichiers (< 1 Mo, 10 pages) : 10-30 secondes
- Fichiers moyens (1-5 Mo, 10-50 pages) : 30-90 secondes
- Gros fichiers (5-10 Mo, 50+ pages) : 2-5 minutes
Problèmes Courants de Fichiers
Échec du traitement
Échec du traitement
Causes :
- Le fichier dépasse 10 Mo
- Le fichier est protégé par mot de passe
- Le fichier est corrompu
- Images numérisées de très mauvaise qualité
- Compresser le fichier ou le diviser en fichiers plus petits
- Supprimer la protection par mot de passe
- Ré-exporter le fichier depuis la source
- Pour les numérisations de très mauvaise qualité, Copie le contenu dans un élément texte
Contenu extrait incorrectement
Contenu extrait incorrectement
Causes :
- Mises en page complexes (multi-colonnes, tableaux)
- Images numérisées de très mauvaise qualité
- Polices ou encodage spéciaux
- Champs de formulaire et éléments interactifs
- Vérifier le contenu extrait en mode édition
- Recréer en tant qu’élément texte avec formatage approprié
- Simplifier la mise en page du document avant téléchargement
- Exporter en tant que document texte brut
Le traitement prend trop de temps
Le traitement prend trop de temps
Que faire :
- Attendre 5-10 minutes avant de supposer un échec
- Vérifier la taille du fichier et le nombre de pages
- Pour les gros fichiers, envisager de diviser en plusieurs fichiers
- Convertir en texte et télécharger en tant qu’éléments TEXT
Meilleures Pratiques de Téléchargement de Fichiers
Optimiser avant téléchargement
- Compresser les gros fichiers
- Supprimer les images inutiles
- Utiliser des documents textuels
- Rester sous 5 Mo si possible
Tester l'extraction
- Réviser le contenu extrait après traitement
- Vérifier les problèmes de formatage
- Vérifier que les informations critiques sont exactes
- Retélécharger si l’extraction est mauvaise
Éléments URL
Que sont les Éléments URL ?
Les éléments URL extraient le contenu de pages web et le stockent dans ton base de connaissances. C’est utile pour référencer la documentation en ligne, les centres d’aide ou les articles de blog.Quand Utiliser les Éléments URL
Documentation publique
Documentation publique
Référencer la documentation externe que vous ne Maintiens pas.Exemples :
- Documentation API (la vôtre ou tierce)
- Bases de connaissances publiques
- Articles de centre d’aide
- Pages produit
Contenu fréquemment mis à jour
Contenu fréquemment mis à jour
Contenu qui change régulièrement et que tu souhaites maintenir à jour en le ré-extrayant.Exemples :
- Pages de tarification
- Disponibilité produit
- Promotions actuelles
- Pages de statut
Articles de blog ou articles
Articles de blog ou articles
Contenu éducatif ou annonces.Exemples :
- Guides pratiques
- Articles de meilleures pratiques
- Annonces de produits
- Tutoriels de fonctionnalités
Créer des Éléments URL
Exemple JSON d’Élément URL
Exigences URL
URLs fonctionnelles :- Accessibles publiquement (pas de connexion requise)
- Pages de contenu HTML simples
- Sites de documentation
- Articles de blog
- Pages de contenu statique
- Pages nécessitant une authentification
- Applications riches en JavaScript (SPA)
- Contenu payant
- Contenu chargé dynamiquement
- Applications interactives
L’extraction URL fonctionne mieux avec des pages web simples basées sur du texte. Les applications web complexes peuvent ne pas s’extraire avec succès.
Problèmes Courants d’URL
Échec de l'extraction
Échec de l'extraction
Causes :
- La page nécessite une connexion/authentification
- L’URL est incorrecte ou rompue
- Le contenu se charge via JavaScript
- Le site web bloque l’extraction (robots.txt)
- La page n’existe pas (404)
- Vérifier que l’URL est accessible publiquement
- Tester l’URL dans une fenêtre de navigateur privée
- Vérifier que l’URL est complète et correcte
- Copier le contenu manuellement dans un élément texte
- Utiliser l’export PDF de la page à la place
Contenu incomplet ou incorrect
Contenu incomplet ou incorrect
Causes :
- Contenu rendu JavaScript non capturé
- Chargement de contenu dynamique
- Plusieurs onglets/sections sur la page
- Commentaires ou barre latérale extraits au lieu du contenu principal
- Inspecter le contenu extrait en mode édition
- Utiliser l’URL directe vers le contenu spécifique
- Copier le contenu désiré dans un élément texte
- Exporter la page en PDF et télécharger à la place
Le contenu devient obsolète
Le contenu devient obsolète
Solution :
Le contenu URL est extrait une fois au moment de la création. Pour mettre à jour :
- Supprimer et recréer l’élément URL
- Ou copier le contenu actuel dans un élément texte pour des mises à jour manuelles
- Des éléments texte manuels que tu mets à jour régulièrement
- Des exports PDF que vous Rafraîchis périodiquement
Meilleures Pratiques URL
Tester l'accessibilité
- Ouvrir l’URL dans une fenêtre privée
- Vérifier qu’aucune connexion n’est requise
- Vérifier que le contenu est visible
- S’assurer que la page se charge rapidement
Réviser le contenu extrait
- Vérifier le contenu après extraction
- Vérifier que le bon contenu a été capturé
- Rechercher des problèmes de formatage
- Confirmer qu’il n’y a pas de contenu supplémentaire (publicités, barres latérales)
Flux de Statut de Traitement
Les éléments de connaissance passent par deux pipelines de traitement distincts :- Traitement du Contenu - Extraction du texte depuis les fichiers/URLs
- Indexation Vectorielle - Préparation du contenu pour RAG (recherche sémantique)
Statut de Traitement du Contenu
Cela suit l’extraction du contenu textuel depuis ton source.PENDING
Signification : Élément créé, en file d’attente pour l’extraction de contenuCe qui se passe :
- L’élément a été enregistré dans la base de données
- En attente qu’un worker de traitement le prenne en charge
- Généralement très bref (secondes)
PROCESSING
Signification : Le contenu de l’élément est en cours d’extractionCe qui se passe :
- Pour les FICHIERS : Extraction de texte depuis PDF, Word, etc.
- Pour les URLs : Récupération et extraction de la page web spécifique
- Pour le TEXTE : N/A (passe directement à COMPLETED)
COMPLETED
Signification : Extraction du contenu terminée avec succèsCe qui se passe :
- Le contenu a été extrait et stocké
- L’indexation vectorielle commencera automatiquement
- L’élément sera disponible une fois l’indexation terminée
FAILED
Signification : L’extraction du contenu a rencontré une erreurCe qui se passe :
- L’extraction du fichier a échoué (PDF corrompu, format non pris en charge)
- L’extraction d’URL a échoué (page introuvable, bloquée, nécessite authentification)
- Le contenu n’est pas disponible pour les agents
Statut d’Indexation Vectorielle
Après l’extraction du contenu, il doit être indexé pour RAG (recherche sémantique). Cela permet aux agents de trouver les connaissances pertinentes en fonction du sens, pas seulement des mots-clés.PENDING
Signification : En attente du début de l’indexation vectorielleCe qui se passe :
- Le traitement du contenu s’est terminé avec succès
- En file d’attente pour la génération d’embeddings
- Généralement bref (secondes à minutes)
INDEXING
Signification : Création d’embeddings vectoriels pour RAGCe qui se passe :
- Le contenu est divisé en morceaux
- Des embeddings IA sont générés pour chaque morceau
- Les vecteurs sont stockés dans la base de connaissances
INDEXED
Signification : L’élément est entièrement prêt pour la récupération RAGCe qui se passe :
- Les embeddings vectoriels sont stockés avec succès
- L’élément peut être récupéré via recherche sémantique
- Les agents peuvent maintenant utiliser ces connaissances
FAILED
Signification : L’indexation vectorielle a échouéCe qui se passe :
- La génération d’embeddings a rencontré une erreur
- L’élément n’apparaîtra pas dans les résultats RAG
- Peut être disponible uniquement pour l’injection de contexte
Les deux statuts doivent réussir pour une fonctionnalité complète :
- Statut Contenu : COMPLETED
- Statut Vecteur : INDEXED
Gestion des Erreurs
Quand les Éléments Échouent
Si un élément de connaissance affiche le statut FAILED :Identifier la cause
Causes courantes :
- Fichiers : Fichier trop volumineux, corrompu, protégé par mot de passe, image numérisée
- URL : Authentification requise, lien rompu, contenu non accessible
Essayer des solutions
- Pour les Fichiers : Compresser, supprimer la protection, ajouter une couche de texte, ou convertir en texte
- Pour les URLs : Vérifier l’accessibilité, essayer une URL différente, ou copier le contenu dans un élément texte
Prévenir les Erreurs
Prévention Fichiers
- Garder les fichiers sous 5 Mo
- Utiliser des documents textuels ou des numérisations de qualité
- Supprimer les mots de passe
- Tester avec un petit fichier d’abord
Prévention URL
- Tester l’URL en mode privé
- Utiliser des pages HTML simples
- Éviter le contenu authentifié
- Vérifier la compatibilité robots.txt
Surveillance du Traitement
Indicateurs du Tableau de Bord
Dans ton tableau de bord de base de connaissances, tu peux voir le statut de traitement d’un coup d’œil pour chaque élément dans tes dossiers : Indicateurs de statut :- Coche verte = COMPLETED
- Sablier = PROCESSING
- Symbole pause = PENDING
- X rouge = FAILED
- Manuel Utilisateur.pdf - COMPLETED
- Guide Démarrage Rapide.pdf - PROCESSING
- Documentation API - PENDING
- Manuel Hérité.pdf - FAILED
Traitement par Lots
Lors du téléchargement de plusieurs éléments :- Les éléments se traitent séquentiellement ou en parallèle (dépend du système)
- Revenir après 5-10 minutes pour les gros lots
- Réviser le statut de chaque élément
- Corriger les échecs individuellement
Choisir le Bon Type de Contenu
Utilise cet arbre de décision pour sélectionner le meilleur type de contenu : As-tu du contenu existant ?- Non → Utilise TEXT (écrire directement)
- Oui, c’est un document →
- Moins de 10 Mo → Utilise FILE
- Plus de 10 Mo → Extraire le texte, utiliser TEXT
- Oui, c’est une page web →
- Accessible publiquement → Utilise URL (si l’extraction échoue, Copie vers TEXT)
- Non accessible → Copie le contenu vers TEXT
Recommandations Rapides
| Ton Situation | Meilleur Type de Contenu |
|---|---|
| Rédiger des FAQ depuis zéro | TEXT |
| Avoir des documents Word/PDF existants | Télécharger comme FILE |
| Avoir des documents sous 10 Mo | FILE |
| Avoir des documents sur 10 Mo | Diviser en fichiers plus petits ou extraire vers TEXT |
| Documentation web publique | URL (avec TEXT comme solution de secours) |
| Contenu privé/authentifié | Copier vers TEXT |
| Besoin de disponibilité immédiate | TEXT (pas de délai de traitement) |
| Le formatage complexe compte | FILE |
Prochaines Étapes
Contexte vs RAG
Découvrir comment les agents accèdent à ton contenu de connaissances
Créer des Bases de Connaissances
Guide de création étape par étape
Aperçu de l'Architecture
Comprendre la structure des bases de connaissances
Variables & Contenu Dynamique
Référencer les connaissances dans les instructions de l’agent