Panoramica
Quando assegni conoscenza al tuo agente, devi scegliere come l’agente accede a queste informazioni. itellicoAI offre due metodi di accesso: Modalità Context (iniezione prompt) e Modalità RAG (Generazione Aumentata da Recupero). Comprendere la differenza tra questi approcci ti aiuterà a ottimizzare le prestazioni e l’accuratezza del tuo agente.I Due Metodi di Accesso
Modalità Context
Iniezione PromptTutta la conoscenza viene iniettata direttamente nel contesto di conversazione dell’agente all’inizio di ogni interazione.Ideale per: Piccole basi di conoscenza con informazioni critiche di cui l’agente ha bisogno per ogni conversazione.
Modalità RAG
Generazione Aumentata da RecuperoL’agente cerca e recupera dinamicamente la conoscenza rilevante in base all’argomento della conversazione.Ideale per: Grandi basi di conoscenza dove solo sezioni specifiche sono necessarie per conversazione.
Modalità Context (Iniezione Prompt)
Come Funziona
In Modalità Context, il contenuto della tua base di conoscenza viene caricato direttamente nel prompt di sistema dell’agente all’inizio di ogni conversazione:Output Formattato
Per impostazione predefinita, la conoscenza viene iniettata con formattazione strutturata:Quando Usare la Modalità Context
Piccole basi di conoscenza (< 1.000 parole)
Piccole basi di conoscenza (< 1.000 parole)
Se la tua base di conoscenza è compatta, la Modalità Context assicura che l’agente abbia sempre il contesto completo.Esempio caso d’uso:
Un agente di supporto con una base di conoscenza contenente:
- 10 FAQ comuni
- Politica di reso (500 parole)
- Informazioni di contatto
- Opzioni di spedizione
Informazioni critiche necessarie ogni volta
Informazioni critiche necessarie ogni volta
Informazioni a cui l’agente deve fare riferimento nella maggior parte o in tutte le chiamate.Esempio caso d’uso:
Un agente di prenotazione che necessita di:
- Politiche aziendali (sempre)
- Servizi disponibili (sempre)
- Struttura dei prezzi (sempre)
- Procedure di prenotazione (sempre)
Informazioni altamente strutturate
Informazioni altamente strutturate
Quando gli elementi di conoscenza si riferiscono l’uno all’altro o formano un insieme coeso.Esempio caso d’uso:
Agente di configurazione prodotto con:
- Dipendenze delle opzioni (“Se scelgono X, offrire Y”)
- Matrice di compatibilità
- Pacchetti bundle
- Prezzi che dipendono dalle combinazioni
Vantaggi della Modalità Context
Sempre Disponibile
L’agente ha accesso immediato a tutta la conoscenza senza ritardo di ricerca
Meglio per Piccoli Set
Efficiente quando la conoscenza si adatta comodamente nella finestra di contesto
Deterministico
L’agente vede esattamente la stessa conoscenza ogni volta
Funziona con Variabili
La conoscenza può includere variabili Jinja che si risolvono nel contesto
Limitazioni della Modalità Context
Limitazioni:- Mantieni le basi di conoscenza piccole (< 1.000 parole)
- Tutta la conoscenza viene inviata con ogni richiesta (costo maggiore)
- Tutta la conoscenza viene elaborata ogni volta (latenza maggiore)
- L’intera base di conoscenza è inclusa anche se solo una piccola parte è rilevante
Modalità RAG (Generazione Aumentata da Recupero)
Come Funziona
In Modalità RAG, la tua base di conoscenza è memorizzata in un database vettoriale. Quando l’agente ha bisogno di informazioni:- L’utente fa una domanda: “Qual è la vostra politica di reso?”
- L’agente identifica la necessità: L’agente determina che ha bisogno di conoscenza sui resi
- Il sistema cerca: Il sistema RAG cerca nella base di conoscenza il contenuto rilevante
- Il contenuto rilevante viene recuperato: Solo la sezione della politica di reso viene recuperata
- L’agente risponde: L’agente usa la conoscenza recuperata per rispondere
Recupero Intelligente
RAG usa la ricerca semantica con embedding vettoriali per trovare conoscenza rilevante:Vantaggi della Modalità RAG
Scala Infinitamente
Supporta basi di conoscenza massive senza limiti di contesto
Più Veloce per Grandi Conoscenze
Riduce i token del prompt di sistema per grandi basi di conoscenza
Efficiente
Recupera solo ciò che è necessario per l’argomento corrente
Meglio per la Diversità
Gestisce bene un’ampia varietà di argomenti non correlati
Considerazioni sulla Modalità RAG
RAG si basa sulla qualità dell’embedding vettoriale. Se i tuoi elementi di conoscenza non sono scritti chiaramente, il recupero potrebbe perdere informazioni rilevanti.
- Titoli di elementi di conoscenza chiari e descrittivi
- Contenuto ben strutturato
- Corretta categorizzazione in cartelle
- Evitare informazioni duplicate o in conflitto
Indicatore Token di Contesto Rimanenti
Quando usi la Modalità Context, monitora i tuoi token di contesto rimanenti per assicurarti di avere abbastanza spazio per le conversazioni.Comprendere l’Indicatore
Il dashboard mostra l’utilizzo del tuo contesto nelle impostazioni di Conoscenza:

- Modalità RAG: Ricerca vettoriale dinamica con dimensione della conoscenza illimitata
- Modalità Context: Aggiunto al prompt di sistema con limite di 10.000 token
Scegliere la Modalità Giusta
Usa questa guida decisionale per selezionare il miglior metodo di accesso:Approccio Ibrido
Puoi usare entrambe le modalità per diverse basi di conoscenza sullo stesso agente: Esempio di configurazione:- Modalità Context: Piccola base di conoscenza “Politiche Principali” (sempre necessaria)
- Modalità RAG: Grande base di conoscenza “Catalogo Prodotti” (recupera quando necessario)
Testare la Tua Configurazione
Assegna base di conoscenza
Configura il tuo agente con una base di conoscenza in Modalità Context o RAG.
Fai domande sul contenuto della conoscenza
Fai domande che dovrebbero essere risposte dalla tua base di conoscenza.Esempi di domande:
- “Qual è la vostra politica di reso?”
- “Quanto costa il piano Pro?”
- “Quali sono i vostri orari di apertura?”
Verifica le risposte
Conferma che l’agente sta usando correttamente il contenuto della conoscenza nelle risposte.
Best Practice
Inizia con RAG per basi grandi
Inizia con RAG per basi grandi
In caso di dubbio, usa la Modalità RAG. È più sicura per grandi basi di conoscenza e puoi sempre passare alla Modalità Context se necessario.
Scrivi contenuto chiaro e completo
Scrivi contenuto chiaro e completo
RAG usa la ricerca semantica per trovare conoscenza rilevante. Scrivi contenuto completo e ben scritto che include naturalmente i termini e i concetti su cui gli utenti faranno domande.Buono: “La nostra politica di reso consente resi entro 30 giorni dall’acquisto per prodotti fisici. I prodotti digitali non possono essere restituiti una volta scaricati.”Cattivo: “Vedi documento politica” o frammenti di frasi incomplete
Testa entrambe le modalità
Testa entrambe le modalità
Prova sia la Modalità Context che RAG con la tua base di conoscenza e vedi quale funziona meglio per il tuo caso d’uso.
Combina strategicamente
Combina strategicamente
Usa la Modalità Context per informazioni critiche e frequentemente necessarie e la Modalità RAG per materiale di riferimento esteso.
Risoluzione Problemi
L'agente non usa la conoscenza (Modalità Context)
L'agente non usa la conoscenza (Modalità Context)
Controlla:
- Tutti gli elementi di conoscenza sono in stato COMPLETED?
- Il contesto rimanente è sufficiente (non troncato)?
- Risolvi gli elementi falliti
- Riduci la dimensione della conoscenza o passa a RAG
L'agente non trova la conoscenza (Modalità RAG)
L'agente non trova la conoscenza (Modalità RAG)
Controlla:
- Il contenuto è ben organizzato?
- Stai facendo domande che corrispondono alla conoscenza?
- Aggiungi contenuto più dettagliato
- Testa con formulazioni diverse
- Considera di aggiungere parole chiave al contenuto
L'agente fornisce informazioni errate o obsolete
L'agente fornisce informazioni errate o obsolete
Controlla:
- Il contenuto della conoscenza è corretto e attuale?
- Hai informazioni in conflitto in più elementi?
- Aggiorna il contenuto della conoscenza
- Rimuovi duplicati e conflitti
Utilizzo del contesto troppo alto
Utilizzo del contesto troppo alto
Soluzioni:
- Passa alla Modalità RAG per grandi basi di conoscenza
- Dividi la conoscenza in basi più piccole e focalizzate
- Riduci la lunghezza delle istruzioni dell’agente
- Rimuovi contenuto verboso o ridondante