Übersicht
itellicoAI unterstützt drei Arten von Wissenselementtypen, die jeweils für verschiedene Inhaltsquellen und Anwendungsfälle konzipiert sind. Das Verständnis der Funktionsweise und Verarbeitung jedes Typs hilft dir, das richtige Format für deine Informationen zu wählen.Übersicht der Inhaltstypen
Textelemente
Datei-Uploads
URL-Scraping
Textelemente
Was sind Textelemente?
Textelemente sind Inhalte, die du direkt in den itellicoAI-Wissensdatenbank-Editor eingibst. Sie sind der einfachste und zuverlässigste Inhaltstyp.Wann Textelemente verwenden
FAQs schreiben
FAQs schreiben
Richtlinien-Zusammenfassungen erstellen
Richtlinien-Zusammenfassungen erstellen
Verfahren dokumentieren
Verfahren dokumentieren
Schnellreferenz-Informationen
Schnellreferenz-Informationen
Textelemente erstellen
Auf 'Wissensobjekt hinzufügen' klicken
Inhalt schreiben
- Überschriften für Abschnitte
- Aufzählungspunkte für Listen
- Zahlen für Schritte
- Fettdruck für Betonung
Textelement JSON-Beispiel
Vorteile von Textelementen
Sofortige Verarbeitung
Volle Kontrolle
Einfache Aktualisierungen
Zuverlässig
Datei-Upload-Elemente
Was sind Datei-Upload-Elemente?
Datei-Upload-Elemente ermöglichen es dir, vorhandene Dokumente in verschiedenen Formaten hochzuladen. Das System extrahiert den Textinhalt und stellt ihn deinen Agenten zur Verfügung.Wann Datei-Uploads verwenden
Vorhandene Dokumentation
Vorhandene Dokumentation
- Benutzerhandbücher
- Produktspezifikationen
- Rechtliche Dokumente
- Schulungsunterlagen
Formatierte Dokumente
Formatierte Dokumente
- Technische Diagramme
- Tabellen und Diagramme
- Mehrspaltenlayouts
- Markenvorlagen
Dokumente von Dritten
Dokumente von Dritten
- Lieferantenkataloge
- Compliance-Dokumente
- Zertifizierungsmaterialien
Dateianforderungen
Dateispezifikationen:- Formate: PDF, DOC, DOCX, TXT und andere Dokumentformate
- Größenbeschränkung: maximal 10MB
- Inhalt: Textbasierte Dokumente und gescannte Bilder (erweiterte Analyse verarbeitet die meisten Scans)
- Schutz: Kein Passwortschutz
Dateielemente erstellen
Auf 'Wissensobjekt hinzufügen' klicken
Dateielement JSON-Beispiel
Verarbeitungszeit
Die Dateiverarbeitungszeit variiert je nach:- Dateigröße: Größere Dateien benötigen länger
- Seitenzahl: Mehr Seiten = längere Verarbeitung
- Komplexität: Tabellen, Bilder und komplexe Layouts verlangsamen die Verarbeitung
- Textqualität: Sauberer, einfacher Text extrahiert schneller
- Kleine Dateien (< 1MB, 10 Seiten): 10-30 Sekunden
- Mittlere Dateien (1-5MB, 10-50 Seiten): 30-90 Sekunden
- Große Dateien (5-10MB, 50+ Seiten): 2-5 Minuten
Häufige Dateiprobleme
Verarbeitung fehlgeschlagen
Verarbeitung fehlgeschlagen
- Datei überschreitet 10MB
- Datei ist passwortgeschützt
- Datei ist beschädigt
- Sehr schlechte gescannte Bildqualität
- Datei komprimieren oder in kleinere Dateien aufteilen
- Passwortschutz entfernen
- Datei aus Quelle neu exportieren
- Bei sehr schlechter Scan-Qualität Inhalt stattdessen in Textelement kopieren
Inhalt falsch extrahiert
Inhalt falsch extrahiert
- Komplexe Layouts (mehrspaltiger Text, Tabellen)
- Sehr schlechte gescannte Bildqualität
- Spezielle Schriftarten oder Kodierung
- Formularfelder und interaktive Elemente
- Extrahierten Inhalt im Bearbeitungsmodus überprüfen
- Als Textelement mit richtiger Formatierung neu erstellen
- Dokumentlayout vor dem Hochladen vereinfachen
- Als Klartextdokument exportieren
Verarbeitung dauert zu lange
Verarbeitung dauert zu lange
- 5-10 Minuten warten, bevor du einen Fehler annehmen
- Dateigröße und Seitenzahl überprüfen
- Bei großen Dateien in mehrere Dateien aufteilen erwägen
- In Text konvertieren und stattdessen als TEXT-Elemente hochladen
Best Practices für Datei-Uploads
Vor Upload optimieren
- Große Dateien komprimieren
- Unnötige Bilder entfernen
- Textbasierte Dokumente verwenden
- Wenn möglich unter 5MB halten
Extraktion testen
- Extrahierten Inhalt nach Verarbeitung überprüfen
- Auf Formatierungsprobleme prüfen
- Kritische Informationen auf Genauigkeit überprüfen
- Bei schlechter Extraktion erneut hochladen
URL-Elemente
Was sind URL-Elemente?
URL-Elemente scrapen Inhalte von Webseiten und speichern sie in deiner Wissensdatenbank. Dies ist nützlich, um online Dokumentationen, Hilfe-Center oder Blog-Beiträge zu referenzieren.Wann URL-Elemente verwenden
Öffentliche Dokumentation
Öffentliche Dokumentation
- API-Dokumentation (eigene oder von Dritten)
- Öffentliche Wissensdatenbanken
- Hilfe-Center-Artikel
- Produktseiten
Häufig aktualisierte Inhalte
Häufig aktualisierte Inhalte
- Preisseiten
- Produktverfügbarkeit
- Aktuelle Aktionen
- Statusseiten
Blog-Beiträge oder Artikel
Blog-Beiträge oder Artikel
- Anleitungen
- Best-Practice-Artikel
- Produktankündigungen
- Feature-Tutorials
URL-Elemente erstellen
Auf 'Wissensobjekt hinzufügen' klicken
URL-Element JSON-Beispiel
URL-Anforderungen
Funktionierende URLs:- Öffentlich zugänglich (keine Anmeldung erforderlich)
- Einfache HTML-Inhaltsseiten
- Dokumentationsseiten
- Blog-Beiträge und Artikel
- Statische Inhaltsseiten
- Seiten, die Authentifizierung erfordern
- JavaScript-lastige Anwendungen (SPAs)
- Inhalte hinter Bezahlschranken
- Dynamisch geladene Inhalte
- Interaktive Anwendungen
Häufige URL-Probleme
Scraping fehlgeschlagen
Scraping fehlgeschlagen
- Seite erfordert Anmeldung/Authentifizierung
- URL ist falsch oder defekt
- Inhalt lädt über JavaScript
- Website blockiert Scraping (robots.txt)
- Seite existiert nicht (404)
- Überprüfen, ob URL öffentlich zugänglich ist
- URL im Inkognito-Browserfenster testen
- Überprüfen, ob URL vollständig und korrekt ist
- Inhalt manuell in Textelement kopieren
- PDF-Export der Seite stattdessen verwenden
Inhalt unvollständig oder falsch
Inhalt unvollständig oder falsch
- JavaScript-gerenderte Inhalte nicht erfasst
- Dynamisches Laden von Inhalten
- Mehrere Tabs/Abschnitte auf der Seite
- Kommentare oder Seitenleisten statt Hauptinhalt gescrapt
- Gescrapten Inhalt im Bearbeitungsmodus überprüfen
- Direkte URL zu spezifischem Inhalt verwenden
- Gewünschten Inhalt in Textelement kopieren
- Seite als PDF exportieren und stattdessen hochladen
Inhalt wird veraltet
Inhalt wird veraltet
- URL-Element löschen und neu erstellen
- Oder aktuellen Inhalt in ein Textelement kopieren für manuelle Aktualisierungen
- Manuelle Textelemente, die du regelmäßig aktualisierst
- PDF-Exporte, die du regelmäßig aktualisierst
URL Best Practices
Zugänglichkeit testen
- URL im Inkognito-Fenster öffnen
- Überprüfen, dass keine Anmeldung erforderlich ist
- Prüfen, ob Inhalt sichtbar ist
- Sicherstellen, dass Seite schnell lädt
Gescrapten Inhalt überprüfen
- Inhalt nach Scraping überprüfen
- Überprüfen, ob korrekter Inhalt erfasst wurde
- Auf Formatierungsprobleme achten
- Bestätigen, dass keine zusätzlichen Inhalte (Anzeigen, Seitenleisten) vorhanden sind
Verarbeitungsstatus-Ablauf
Wissenselemente durchlaufen zwei separate Verarbeitungspipelines:- Inhaltsverarbeitung - Extrahieren von Text aus Dateien/URLs
- Vektor-Indizierung - Vorbereitung von Inhalten für RAG (semantische Suche)
Inhaltsverarbeitungsstatus
Dies verfolgt die Extraktion von Textinhalten aus deiner Quelle.AUSSTEHEND
- Element wurde in Datenbank gespeichert
- Wartet darauf, dass Verarbeitungs-Worker es aufnimmt
- Normalerweise sehr kurz (Sekunden)
VERARBEITUNG
- Für DATEIEN: Text wird aus PDF, Word usw. extrahiert
- Für URLs: Die spezifische Webseite wird abgerufen und gescrapt
- Für TEXT: N/A (springt direkt zu ABGESCHLOSSEN)
ABGESCHLOSSEN
- Inhalt wurde extrahiert und gespeichert
- Vektor-Indizierung beginnt automatisch
- Element wird verfügbar sein, sobald Indizierung abgeschlossen ist
FEHLGESCHLAGEN
- Dateiextraktion fehlgeschlagen (beschädigtes PDF, nicht unterstütztes Format)
- URL-Scraping fehlgeschlagen (Seite nicht gefunden, blockiert, erfordert Auth)
- Inhalt ist für Agenten nicht verfügbar
Vektor-Indizierungsstatus
Nachdem Inhalte extrahiert wurden, müssen sie für RAG (semantische Suche) indiziert werden. Dies ermöglicht es Agenten, relevantes Wissen basierend auf Bedeutung zu finden, nicht nur auf Schlüsselwörtern.AUSSTEHEND
- Inhaltsverarbeitung erfolgreich abgeschlossen
- In Warteschlange für Embedding-Generierung
- Normalerweise kurz (Sekunden bis Minuten)
INDIZIERUNG
- Inhalt wird in Chunks aufgeteilt
- KI-Embeddings werden für jeden Chunk generiert
- Vektoren werden in der Wissensdatenbank gespeichert
INDIZIERT
- Vektor-Embeddings erfolgreich gespeichert
- Element kann über semantische Suche abgerufen werden
- Agenten können dieses Wissen jetzt nutzen
FEHLGESCHLAGEN
- Embedding-Generierung hat einen Fehler festgestellt
- Element erscheint nicht in RAG-Ergebnissen
- Möglicherweise nur für Kontext-Injektion verfügbar
- Inhaltsstatus: ABGESCHLOSSEN
- Vektor-Status: INDIZIERT
Fehlerbehandlung
Wenn Elemente fehlschlagen
Wenn ein Wissensobjekt den Status FEHLGESCHLAGEN anzeigt:Ursache identifizieren
- Dateien: Datei zu groß, beschädigt, passwortgeschützt, gescanntes Bild
- URL: Authentifizierung erforderlich, defekter Link, Inhalt nicht zugänglich
Lösungen ausprobieren
- Für Dateien: Komprimieren, Schutz entfernen, Textebene hinzufügen oder in Text konvertieren
- Für URLs: Zugänglichkeit überprüfen, andere URL versuchen oder Inhalt in Textelement kopieren
Fehler vermeiden
Datei-Prävention
- Dateien unter 5MB halten
- Textbasierte Dokumente oder qualitativ hochwertige Scans verwenden
- Passwörter entfernen
- Zuerst mit kleiner Datei testen
URL-Prävention
- URL im Inkognito-Modus testen
- Einfache HTML-Seiten verwenden
- Authentifizierte Inhalte vermeiden
- robots.txt-Kompatibilität prüfen
Verarbeitung überwachen
Dashboard-Indikatoren
In deinem Wissensdatenbank-Dashboard kannst du den Verarbeitungsstatus auf einen Blick für jedes Element in deinen Ordnern sehen: Status-Indikatoren:- Grünes Häkchen = ABGESCHLOSSEN
- Sanduhr = VERARBEITUNG
- Pausensymbol = AUSSTEHEND
- Rotes X = FEHLGESCHLAGEN
- Benutzerhandbuch.pdf - ABGESCHLOSSEN
- Schnellstartanleitung.pdf - VERARBEITUNG
- API-Dokumentation - AUSSTEHEND
- Legacy-Handbuch.pdf - FEHLGESCHLAGEN
Massenverarbeitung
Beim Hochladen mehrerer Elemente:- Elemente werden sequenziell oder parallel verarbeitet (systemabhängig)
- Prüfe nach 5-10 Minuten bei großen Stapeln zurück
- Überprüfe den Status jedes Elements
- Behebe eventuelle Fehler einzeln
Den richtigen Inhaltstyp wählen
Verwende diesen Entscheidungsbaum, um den besten Inhaltstyp auszuwählen: Hast du vorhandene Inhalte?- Nein → TEXT verwenden (direkt schreiben)
- Ja, es ist ein Dokument →
- Unter 10MB → FILE verwenden
- Über 10MB → Text extrahieren, TEXT verwenden
- Ja, es ist eine Webseite →
- Öffentlich zugänglich → URL verwenden (wenn Scraping fehlschlägt, in TEXT kopieren)
- Nicht zugänglich → Inhalt in TEXT kopieren
Schnellempfehlungen
| Deine Situation | Bester Inhaltstyp |
|---|---|
| FAQs von Grund auf schreiben | TEXT |
| Vorhandene Word/PDF-Dokumente haben | Als FILE hochladen |
| Dokumente unter 10MB haben | FILE |
| Dokumente über 10MB haben | In kleinere Dateien aufteilen oder zu TEXT extrahieren |
| Öffentliche Web-Dokumentation | URL (mit TEXT als Backup) |
| Private/authentifizierte Inhalte | In TEXT kopieren |
| Sofortige Verfügbarkeit benötigen | TEXT (keine Verarbeitungsverzögerung) |
| Komplexe Formatierung wichtig | FILE |