Vue d’ensemble
Lorsque tu attribues des connaissances à ton agent, tu dois choisir comment l’agent accède à ces informations. itellicoAI offre deux méthodes d’accès : Mode Contexte (injection de prompt) et Mode RAG (Génération Augmentée par Récupération). Comprendre la différence entre ces approches t’aidera à optimiser les performances et la précision de ton agent.Les Deux Méthodes d’Accès
Mode Contexte
Injection de PromptToutes les connaissances sont injectées directement dans le contexte de conversation de l’agent au début de chaque interaction.Idéal pour : Les petites bases de connaissances avec des informations critiques dont l’agent a besoin pour chaque conversation.
Mode RAG
Génération Augmentée par RécupérationL’agent recherche et récupère dynamiquement les connaissances pertinentes en fonction du sujet de conversation.Idéal pour : Les grandes bases de connaissances où seules des sections spécifiques sont nécessaires par conversation.
Mode Contexte (Injection de Prompt)
Comment Ça Fonctionne
En Mode Contexte, le contenu de ta base de connaissances est chargé directement dans le prompt système de l’agent au début de chaque conversation :Sortie Formatée
Par défaut, les connaissances sont injectées avec un formatage structuré :Quand Utiliser le Mode Contexte
Petites bases de connaissances (< 1 000 mots)
Petites bases de connaissances (< 1 000 mots)
Si ta base de connaissances est compacte, le Mode Contexte garantit que l’agent a toujours le contexte complet.Exemple de cas d’usage :
Un agent support avec une base de connaissances contenant :
- 10 FAQ courantes
- Politique de retour (500 mots)
- Coordonnées
- Options d’expédition
Informations critiques nécessaires à chaque fois
Informations critiques nécessaires à chaque fois
Informations que l’agent doit référencer lors de la plupart ou de tous les appels.Exemple de cas d’usage :
Un agent de réservation qui a besoin de :
- Politiques d’entreprise (toujours)
- Services disponibles (toujours)
- Structure de tarification (toujours)
- Procédures de réservation (toujours)
Informations hautement structurées
Informations hautement structurées
Lorsque les éléments de connaissance se référencent les uns aux autres ou forment un tout cohérent.Exemple de cas d’usage :
Agent de configuration produit avec :
- Dépendances d’options (“S’ils choisissent X, proposer Y”)
- Matrice de compatibilité
- Bundles de packages
- Tarification qui dépend des combinaisons
Avantages du Mode Contexte
Toujours Disponible
L’agent a un accès immédiat à toutes les connaissances sans délai de recherche
Meilleur pour Petits Ensembles
Efficace lorsque les connaissances s’intègrent confortablement dans la fenêtre de contexte
Déterministe
L’agent voit exactement les mêmes connaissances à chaque fois
Fonctionne avec Variables
Les connaissances peuvent inclure des variables Jinja qui se résolvent dans le contexte
Limitations du Mode Contexte
Limitations :- Garder les bases de connaissances petites (< 1 000 mots)
- Toutes les connaissances sont envoyées avec chaque requête (coût plus élevé)
- Toutes les connaissances sont traitées à chaque fois (latence plus élevée)
- La base de connaissances entière est incluse même si seule une petite partie est pertinente
Mode RAG (Génération Augmentée par Récupération)
Comment Ça Fonctionne
En Mode RAG, ta base de connaissances est stockée dans une base de données vectorielle. Lorsque l’agent a besoin d’informations :- L’utilisateur pose une question : “Quelle est ta politique de retour ?”
- L’agent identifie le besoin : L’agent détermine qu’il a besoin de connaissances sur les retours
- Le système recherche : Le système RAG recherche dans la base de connaissances le contenu pertinent
- Le contenu pertinent est récupéré : Seule la section politique de retour est récupérée
- L’agent répond : L’agent utilise les connaissances récupérées pour répondre
Récupération Intelligente
RAG utilise la recherche sémantique avec des embeddings vectoriels pour trouver les connaissances pertinentes :Avantages du Mode RAG
Évolue Infiniment
Supporte des bases de connaissances massives sans limites de contexte
Plus Rapide pour Grandes Connaissances
Réduit les tokens du prompt système pour les grandes bases de connaissances
Efficace
Ne récupère que ce qui est nécessaire pour le sujet actuel
Meilleur pour Diversité
Gère bien une grande variété de sujets non liés
Considérations du Mode RAG
RAG repose sur la qualité des embeddings vectoriels. Si tes éléments de connaissance ne sont pas clairement écrits, la récupération peut manquer des informations pertinentes.
- Titres d’éléments de connaissance clairs et descriptifs
- Contenu bien structuré
- Catégorisation appropriée dans les dossiers
- Éviter les informations dupliquées ou contradictoires
Indicateur de Tokens de Contexte Restants
Lors de l’utilisation du Mode Contexte, surveille tes tokens de contexte restants pour t’assurer d’avoir suffisamment d’espace pour les conversations.Comprendre l’Indicateur
Le tableau de bord affiche ton utilisation du contexte dans les paramètres de Connaissance :

- Mode RAG : Recherche vectorielle dynamique avec taille de connaissance illimitée
- Mode Contexte : Ajouté au prompt système avec une limite de 10 000 tokens
Choisir le Bon Mode
Utilise ce guide de décision pour sélectionner la meilleure méthode d’accès :Approche Hybride
Tu peux utiliser les deux modes pour différentes bases de connaissances sur le même agent : Exemple de configuration :- Mode Contexte : Petite base de connaissances “Politiques de Base” (toujours nécessaire)
- Mode RAG : Grande base de connaissances “Catalogue Produit” (récupérer selon besoin)
Tester Ta Configuration
Attribuer la base de connaissances
Configure ton agent avec une base de connaissances en Mode Contexte ou RAG.
Poser des questions sur le contenu des connaissances
Pose des questions qui devraient être répondues depuis ta base de connaissances.Exemples de questions :
- “Quelle est ta politique de retour ?”
- “Combien coûte le plan Pro ?”
- “Quelles sont tes heures d’ouverture ?”
Vérifier les réponses
Confirme que l’agent utilise correctement le contenu des connaissances dans les réponses.
Meilleures Pratiques
Commencer avec RAG pour grandes bases
Commencer avec RAG pour grandes bases
En cas de doute, utilise le Mode RAG. C’est plus sûr pour les grandes bases de connaissances et tu peux toujours passer au Mode Contexte si nécessaire.
Écrire un contenu clair et complet
Écrire un contenu clair et complet
RAG utilise la recherche sémantique pour trouver les connaissances pertinentes. Rédige un contenu complet et bien écrit qui inclut naturellement les termes et concepts que les utilisateurs interrogeront.Bon : “Notre politique de retour permet les retours dans les 30 jours suivant l’achat pour les produits physiques. Les produits numériques ne peuvent pas être retournés une fois téléchargés.”Mauvais : “Voir document politique” ou fragments de phrases incomplets
Tester les deux modes
Tester les deux modes
Essaie à la fois le Mode Contexte et le Mode RAG avec ta base de connaissances et vois lequel fonctionne le mieux pour ton cas d’usage.
Combiner stratégiquement
Combiner stratégiquement
Utilise le Mode Contexte pour les informations critiques et fréquemment nécessaires et le Mode RAG pour les matériaux de référence étendus.
Dépannage
L'agent n'utilise pas les connaissances (Mode Contexte)
L'agent n'utilise pas les connaissances (Mode Contexte)
Vérifier :
- Tous les éléments de connaissance sont-ils en statut COMPLETED ?
- Le contexte restant est-il suffisant (non tronqué) ?
- Corriger les éléments échoués
- Réduire la taille des connaissances ou passer à RAG
L'agent ne trouve pas les connaissances (Mode RAG)
L'agent ne trouve pas les connaissances (Mode RAG)
Vérifier :
- Le contenu est-il bien organisé ?
- Poses-tu des questions qui correspondent aux connaissances ?
- Ajouter un contenu plus détaillé
- Tester avec différentes formulations
- Envisager d’ajouter des mots-clés au contenu
L'agent fournit des informations incorrectes ou obsolètes
L'agent fournit des informations incorrectes ou obsolètes
Vérifier :
- Le contenu des connaissances est-il correct et actuel ?
- As-tu des informations contradictoires dans plusieurs éléments ?
- Mettre à jour le contenu des connaissances
- Supprimer les doublons et les conflits
Utilisation du contexte trop élevée
Utilisation du contexte trop élevée
Solutions :
- Passer au Mode RAG pour les grandes bases de connaissances
- Diviser les connaissances en bases plus petites et ciblées
- Réduire la longueur des instructions de l’agent
- Supprimer le contenu verbeux ou redondant