Panoramica
itellicoAI supporta tre tipi di elementi di conoscenza, ciascuno progettato per diverse fonti di contenuto e casi d’uso. Comprendere come funziona ogni tipo e come vengono elaborati ti aiuterà a scegliere il formato giusto per le tue informazioni.Panoramica dei Tipi di Contenuto
Elementi di Testo
Inserimento diretto del contenuto usando l’editor integrato
Caricamenti di File
Carica PDF, DOC, DOCX, TXT e altri formati di documenti fino a 10MB
Scraping di URL
Estrai contenuto da pagine web
Elementi di Testo
Cosa Sono gli Elementi di Testo?
Gli elementi di testo sono contenuti che inserisci direttamente nell’editor della base di conoscenza di itellicoAI. Sono il tipo di contenuto più diretto e affidabile.Quando Usare gli Elementi di Testo
Scrivere FAQ
Scrivere FAQ
Crea coppie domanda-risposta direttamente nel sistema.Esempio:
Creare riassunti di politiche
Creare riassunti di politiche
Scrivi dichiarazioni di politica chiare e concise.Esempio:
Documentare procedure
Documentare procedure
Istruzioni passo-passo per i processi.Esempio:
Informazioni di riferimento rapido
Informazioni di riferimento rapido
Informazioni brevi, a cui si fa riferimento frequentemente.Esempio:
Creare Elementi di Testo
Scrivi il contenuto
Inserisci il tuo contenuto nell’editor. Usa la formattazione per chiarezza:
- Intestazioni per le sezioni
- Elenchi puntati per le liste
- Numeri per i passaggi
- Grassetto per enfasi
Esempio JSON di Elemento di Testo
Vantaggi degli Elementi di Testo
Elaborazione Istantanea
Gli elementi di testo sono immediatamente disponibili - nessun ritardo di elaborazione
Controllo Completo
Controllo completo sulla formattazione e la struttura del contenuto
Aggiornamenti Facili
Veloci da modificare e aggiornare quando cambiano le informazioni
Affidabile
Nessun errore di elaborazione o problemi di estrazione
Elementi di Caricamento File
Cosa Sono gli Elementi di Caricamento File?
Gli elementi di caricamento file ti permettono di caricare documenti esistenti in vari formati. Il sistema estrae il contenuto testuale e lo rende disponibile ai tuoi agenti.Quando Usare i Caricamenti di File
Documentazione esistente
Documentazione esistente
Hai già contenuto in formato documento.Esempi:
- Manuali utente
- Specifiche di prodotto
- Documenti legali
- Materiali di formazione
Documenti formattati
Documenti formattati
Documenti con layout specifici che sono più facili da mantenere come file.Esempi:
- Diagrammi tecnici
- Tabelle e grafici
- Layout multi-colonna
- Template brandizzati
Documenti di terze parti
Documenti di terze parti
Documentazione che ricevi da fornitori o partner.Esempi:
- Cataloghi fornitori
- Documenti di conformità
- Materiali di certificazione
Requisiti dei File
Specifiche dei file:- Formati: PDF, DOC, DOCX, TXT e altri formati di documenti
- Limite di dimensione: Massimo 10MB
- Contenuto: Documenti basati su testo e immagini scansionate (il parsing avanzato gestisce la maggior parte delle scansioni)
- Protezione: Nessuna protezione con password
Il sistema utilizza il parsing avanzato dei documenti per estrarre testo da immagini scansionate e PDF. La maggior parte dei documenti scansionati verrà elaborata correttamente, anche se scansioni di qualità molto scarsa potrebbero richiedere l’inserimento manuale del testo.
Creare Elementi di File
Esempio JSON di Elemento File
Tempo di Elaborazione
Il tempo di elaborazione dei file varia in base a:- Dimensione del file: File più grandi richiedono più tempo
- Numero di pagine: Più pagine = elaborazione più lunga
- Complessità: Tabelle, immagini e layout complessi rallentano l’elaborazione
- Qualità del testo: Testo pulito e semplice si estrae più velocemente
- File piccoli (< 1MB, 10 pagine): 10-30 secondi
- File medi (1-5MB, 10-50 pagine): 30-90 secondi
- File grandi (5-10MB, 50+ pagine): 2-5 minuti
Problemi Comuni con i File
Elaborazione fallita
Elaborazione fallita
Cause:
- Il file supera i 10MB
- Il file è protetto da password
- Il file è corrotto
- Immagini scansionate di qualità molto scarsa
- Comprimi il file o dividilo in file più piccoli
- Rimuovi la protezione con password
- Riesporta il file dalla fonte
- Per scansioni di qualità molto scarsa, copia il contenuto in un elemento di testo
Contenuto estratto in modo errato
Contenuto estratto in modo errato
Cause:
- Layout complessi (multi-colonna, tabelle)
- Immagini scansionate di qualità molto scarsa
- Font speciali o codifica
- Campi modulo ed elementi interattivi
- Controlla il contenuto estratto in modalità modifica
- Ricrea come elemento di testo con formattazione corretta
- Semplifica il layout del documento prima di caricarlo
- Esporta come documento di testo semplice
L'elaborazione richiede troppo tempo
L'elaborazione richiede troppo tempo
Cosa fare:
- Aspetta 5-10 minuti prima di presumere un fallimento
- Controlla la dimensione del file e il numero di pagine
- Per file grandi, considera di dividerli in più file
- Converti in testo e carica come elementi TEXT
Best Practice per il Caricamento di File
Ottimizza prima del caricamento
- Comprimi file grandi
- Rimuovi immagini non necessarie
- Usa documenti basati su testo
- Mantieni sotto i 5MB quando possibile
Testa l'estrazione
- Rivedi il contenuto estratto dopo l’elaborazione
- Controlla i problemi di formattazione
- Verifica che le informazioni critiche siano accurate
- Ricarica se l’estrazione è scarsa
Elementi URL
Cosa Sono gli Elementi URL?
Gli elementi URL estraggono contenuto da pagine web e lo memorizzano nella tua base di conoscenza. Questo è utile per fare riferimento a documentazione online, centri di assistenza o post di blog.Quando Usare gli Elementi URL
Documentazione pubblica
Documentazione pubblica
Fai riferimento a documentazione esterna che non mantieni.Esempi:
- Documentazione API (tua o di terze parti)
- Basi di conoscenza pubbliche
- Articoli del centro assistenza
- Pagine di prodotto
Contenuto aggiornato frequentemente
Contenuto aggiornato frequentemente
Contenuto che cambia regolarmente e che vuoi mantenere aggiornato ri-estraendo.Esempi:
- Pagine dei prezzi
- Disponibilità prodotti
- Promozioni attuali
- Pagine di stato
Post di blog o articoli
Post di blog o articoli
Contenuto educativo o annunci.Esempi:
- Guide how-to
- Articoli di best practice
- Annunci di prodotto
- Tutorial sulle funzionalità
Creare Elementi URL
Esempio JSON di Elemento URL
Requisiti URL
URL funzionanti:- Accessibili pubblicamente (nessun login richiesto)
- Pagine di contenuto HTML semplici
- Siti di documentazione
- Post di blog e articoli
- Pagine di contenuto statico
- Pagine che richiedono autenticazione
- Applicazioni pesanti in JavaScript (SPA)
- Contenuto a pagamento
- Contenuto caricato dinamicamente
- Applicazioni interattive
Lo scraping di URL funziona meglio con pagine web semplici basate su testo. Applicazioni web complesse potrebbero non essere estratte con successo.
Problemi Comuni con gli URL
Scraping fallito
Scraping fallito
Cause:
- La pagina richiede login/autenticazione
- L’URL è errato o rotto
- Il contenuto si carica tramite JavaScript
- Il sito web blocca lo scraping (robots.txt)
- La pagina non esiste (404)
- Verifica che l’URL sia accessibile pubblicamente
- Testa l’URL in una finestra del browser in incognito
- Controlla che l’URL sia completo e corretto
- Copia il contenuto manualmente in un elemento di testo
- Usa l’esportazione PDF della pagina
Contenuto incompleto o errato
Contenuto incompleto o errato
Cause:
- Contenuto renderizzato con JavaScript non catturato
- Caricamento dinamico del contenuto
- Più schede/sezioni sulla pagina
- Commenti o barra laterale estratti invece del contenuto principale
- Ispeziona il contenuto estratto in modalità modifica
- Usa URL diretto al contenuto specifico
- Copia il contenuto desiderato in un elemento di testo
- Esporta la pagina come PDF e carica invece
Il contenuto diventa obsoleto
Il contenuto diventa obsoleto
Soluzione:
Il contenuto URL viene estratto una volta al momento della creazione. Per aggiornare:
- Elimina e ricrea l’elemento URL
- Oppure copia il contenuto attuale in un elemento di testo per aggiornamenti manuali
- Elementi di testo manuali che aggiorni regolarmente
- Esportazioni PDF che aggiorni periodicamente
Best Practice per gli URL
Testa l'accessibilità
- Apri l’URL in una finestra in incognito
- Verifica che non sia richiesto il login
- Controlla che il contenuto sia visibile
- Assicurati che la pagina si carichi rapidamente
Rivedi il contenuto estratto
- Controlla il contenuto dopo lo scraping
- Verifica che sia stato catturato il contenuto corretto
- Cerca problemi di formattazione
- Conferma che non ci sia contenuto extra (annunci, barre laterali)
Flusso dello Stato di Elaborazione
Gli elementi di conoscenza attraversano due pipeline di elaborazione separate:- Elaborazione del Contenuto - Estrazione del testo da file/URL
- Indicizzazione Vettoriale - Preparazione del contenuto per RAG (ricerca semantica)
Stato Elaborazione Contenuto
Questo traccia l’estrazione del contenuto testuale dalla tua fonte.PENDING
Significato: Elemento creato, in coda per l’estrazione del contenutoCosa sta succedendo:
- L’elemento è stato salvato nel database
- In attesa che il worker di elaborazione lo prelevi
- Solitamente molto breve (secondi)
PROCESSING
Significato: Il contenuto dell’elemento è in fase di estrazioneCosa sta succedendo:
- Per FILE: Estrazione del testo da PDF, Word, ecc.
- Per URL: Recupero e scraping della pagina web specifica
- Per TEXT: N/A (passa direttamente a COMPLETED)
COMPLETED
Significato: Estrazione del contenuto completata con successoCosa sta succedendo:
- Il contenuto è stato estratto e memorizzato
- L’indicizzazione vettoriale inizierà automaticamente
- L’elemento sarà disponibile una volta completata l’indicizzazione
FAILED
Significato: L’estrazione del contenuto ha riscontrato un erroreCosa sta succedendo:
- L’estrazione del file è fallita (PDF corrotto, formato non supportato)
- Lo scraping dell’URL è fallito (pagina non trovata, bloccata, richiede autenticazione)
- Il contenuto non è disponibile per gli agenti
Stato Indicizzazione Vettoriale
Dopo che il contenuto è estratto, deve essere indicizzato per RAG (ricerca semantica). Questo permette agli agenti di trovare conoscenza rilevante basata sul significato, non solo sulle parole chiave.PENDING
Significato: In attesa che inizi l’indicizzazione vettorialeCosa sta succedendo:
- Elaborazione del contenuto completata con successo
- In coda per la generazione di embedding
- Solitamente breve (da secondi a minuti)
INDEXING
Significato: Creazione di embedding vettoriali per RAGCosa sta succedendo:
- Il contenuto viene diviso in blocchi
- Vengono generati embedding AI per ogni blocco
- I vettori vengono memorizzati nella base di conoscenza
INDEXED
Significato: L’elemento è completamente pronto per il recupero RAGCosa sta succedendo:
- Gli embedding vettoriali sono stati memorizzati con successo
- L’elemento può essere recuperato tramite ricerca semantica
- Gli agenti possono ora usare questa conoscenza
FAILED
Significato: L’indicizzazione vettoriale è fallitaCosa sta succedendo:
- La generazione di embedding ha riscontrato un errore
- L’elemento non apparirà nei risultati RAG
- Potrebbe essere disponibile solo per l’iniezione nel contesto
Entrambi gli stati devono avere successo per la piena funzionalità:
- Stato Contenuto: COMPLETED
- Stato Vettoriale: INDEXED
Gestione degli Errori
Quando gli Elementi Falliscono
Se un elemento di conoscenza mostra lo stato FAILED:Identifica la causa
Cause comuni:
- File: File troppo grande, corrotto, protetto da password, immagine scansionata
- URL: Autenticazione richiesta, link rotto, contenuto non accessibile
Prova le soluzioni
- Per File: Comprimi, rimuovi protezione, aggiungi livello di testo, o converti in testo
- Per URL: Verifica accessibilità, prova URL diverso, o copia contenuto in elemento di testo
Prevenire gli Errori
Prevenzione File
- Mantieni i file sotto i 5MB
- Usa documenti basati su testo o scansioni di qualità
- Rimuovi password
- Testa con un file piccolo prima
Prevenzione URL
- Testa l’URL in modalità in incognito
- Usa pagine HTML semplici
- Evita contenuto autenticato
- Controlla la compatibilità robots.txt
Monitoraggio dell’Elaborazione
Indicatori del Dashboard
Nel dashboard della tua base di conoscenza, puoi vedere lo stato di elaborazione a colpo d’occhio per ogni elemento nelle tue cartelle: Indicatori di stato:- Segno di spunta verde = COMPLETED
- Clessidra = PROCESSING
- Simbolo di pausa = PENDING
- X rossa = FAILED
- Manuale Utente.pdf - COMPLETED
- Guida Avvio Rapido.pdf - PROCESSING
- Documentazione API - PENDING
- Manuale Legacy.pdf - FAILED
Elaborazione in Blocco
Quando carichi più elementi:- Gli elementi vengono elaborati in sequenza o in parallelo (dipende dal sistema)
- Controlla dopo 5-10 minuti per batch grandi
- Rivedi lo stato di ogni elemento
- Risolvi eventuali fallimenti individualmente
Scegliere il Tipo di Contenuto Giusto
Usa questo albero decisionale per selezionare il miglior tipo di contenuto: Hai contenuto esistente?- No → Usa TEXT (scrivi direttamente)
- Sì, è un documento →
- Sotto 10MB → Usa FILE
- Oltre 10MB → Estrai testo, usa TEXT
- Sì, è una pagina web →
- Accessibile pubblicamente → Usa URL (se lo scraping fallisce, copia in TEXT)
- Non accessibile → Copia contenuto in TEXT
Raccomandazioni Rapide
| La Tua Situazione | Miglior Tipo di Contenuto |
|---|---|
| Scrivere FAQ da zero | TEXT |
| Hai documenti Word/PDF esistenti | Carica come FILE |
| Hai documenti sotto 10MB | FILE |
| Hai documenti oltre 10MB | Dividi in file più piccoli o estrai in TEXT |
| Documentazione web pubblica | URL (con TEXT come backup) |
| Contenuto privato/autenticato | Copia in TEXT |
| Necessità di disponibilità immediata | TEXT (nessun ritardo di elaborazione) |
| La formattazione complessa è importante | FILE |