Inhaltstypen & Verarbeitung

Unterstützte Inhaltstypen

itellicoAI unterstützt vier Typen von Wissenseinträgen, die jeweils für unterschiedliche Inhaltsquellen und Anwendungsfälle konzipiert sind. Das Verständnis der Funktionsweise jedes Typs hilft dir, das richtige Format für deine Informationen zu wählen. Hinweise zur Organisation dieser Einträge findest du unter Wissensdatenbank-Architektur.

Text-Items

Inhalt direkt über den integrierten Editor eingeben

Datei-Uploads

PDF-, Word-, Excel-, Text-, Markdown-, CSV-, JSON-, YAML- und XML-Dateien bis 10 MB hochladen

URL-Scraping

Inhalt von einer einzelnen Webseite abrufen

Website-Crawl

Mehrere Seiten einer öffentlichen Website entdecken und importieren

Text-Items

Was sind Text-Items?

Text-Items sind Inhalte, die du direkt in den itellicoAI-Wissensdatenbank-Editor eingibst. Sie sind der unkomplizierteste und zuverlässigste Inhaltstyp – sofort verfügbar ohne Verarbeitungsverzögerung.

Wie du ein Text-Item hinzufügst

Zum Ordner navigieren

Öffne den Ordner, in dem du das Item hinzufügen möchtest.

'Eintrag hinzufügen' klicken

Klicke auf Eintrag hinzufügen, um ein neues Item zu erstellen.

'Textinhalt' wählen

Wähle Textinhalt aus den Inhaltstyp-Optionen.

Titel eingeben

Gib deinem Item einen klaren, beschreibenden Titel.

Inhalt schreiben

Gib deinen Inhalt in den Editor ein. Nutze Formatierung für mehr Klarheit:

Überschriften für Abschnitte
Aufzählungspunkte für Listen
Nummern für Schrittfolgen
Fettschrift für Hervorhebungen

'Eintrag erstellen' klicken

Speichere dein Text-Item. Es wird sofort grün.

Best Practices

Für Retrieval strukturieren

Schreibe Inhalt in klaren, in sich geschlossenen Abschnitten. Jeder Abschnitt sollte eine spezifische Frage beantworten, damit RAG (Retrieval-Augmented Generation) fokussierte Ergebnisse zurückgibt.

Beschreibende Titel verwenden

Verbessere Organisation und Retrieval-Genauigkeit mit klaren Namen wie “Rückgaberichtlinie – Digitale Produkte” statt “Richtlinie 4”.

Wann du Text-Items nutzen solltest

FAQs schreiben

Erstelle Frage-und-Antwort-Paare direkt im System.Beispiel:

Title: How do I reset my password?

Content:
To reset your password:

1. Go to the login page
2. Click "Forgot Password"
3. Enter your email address
4. Check your email for a reset link
5. Click the link and create a new password

Password requirements:
- Minimum 8 characters
- At least one uppercase letter
- At least one number
- At least one special character

If you don't receive the email within 5 minutes, check your spam
folder or contact support@company.com.

Richtlinien zusammenfassen

Schreibe klare, prägnante Richtlinienaussagen.Beispiel:

Title: Return Policy - Digital Products

Content:
Digital products can be refunded within 30 days of purchase if:

Eligible for refund:
- Product has a technical defect preventing usage
- Product description was materially inaccurate
- Customer has not accessed or downloaded the product

Not eligible for refund:
- Change of mind after accessing the product
- Compatibility issues disclosed in product description
- User error or misunderstanding of features

To request a refund:
Email support@company.com with your order number and reason
for the refund request.

Processing time: 5-7 business days
Refund method: Original payment method

Abläufe dokumentieren

Schritt-für-Schritt-Anweisungen für Prozesse.Beispiel:

Title: Order Modification Process

Content:
Customers can modify orders within 24 hours of placement.

What can be modified:
- Shipping address
- Delivery speed
- Item quantities (if inventory available)

What cannot be modified:
- Payment method (must cancel and reorder)
- Items after processing has begun
- Orders placed more than 24 hours ago

Modification process:
1. Customer contacts support via phone or email
2. Agent verifies order is within modification window
3. Agent checks inventory for requested changes
4. Agent updates order in system
5. Customer receives confirmation email

If order has already shipped, customer must use return process instead.

Schnellreferenz-Informationen

Kurze, häufig benötigte Informationen.Beispiel:

Title: Business Hours & Contact Information

Content:
Customer Support:
- Phone: 1-800-555-0123
- Email: support@company.com
- Hours: Monday-Friday, 9 AM - 6 PM EST
- After-hours: emergency@company.com (urgent issues only)

Sales:
- Phone: 1-800-555-0124
- Email: sales@company.com
- Hours: Monday-Friday, 8 AM - 8 PM EST

Billing:
- Phone: 1-800-555-0125
- Email: billing@company.com
- Hours: Monday-Friday, 9 AM - 5 PM EST

Einschränkungen

Keine Dateianhänge möglich – Inhalt muss getippt oder eingefügt werden
Große Inhaltsmengen lassen sich besser als Datei-Uploads verwalten

Text-Items sind der zuverlässigste Inhaltstyp. Gib Inhalt wenn möglich als Text ein, anstatt Dateien hochzuladen.

Datei-Upload-Items

Was sind Datei-Upload-Items?

Datei-Upload-Items ermöglichen das Hochladen bestehender Dokumente in verschiedenen Formaten. Das System extrahiert den Textinhalt und stellt ihn deinen Agenten zur Verfügung.

Wie du ein Datei-Item hinzufügst

Zum Ordner navigieren

Öffne den Ordner, in dem du die Datei hinzufügen möchtest.

'Eintrag hinzufügen' klicken

Klicke auf Eintrag hinzufügen, um ein neues Item zu erstellen.

'Datei hochladen' wählen

Wähle Datei hochladen aus den Inhaltstyp-Optionen.

Titel eingeben

Gib deiner Datei einen beschreibenden Titel (dieser ist vom Dateinamen unabhängig).

Datei hochladen

Klicke auf Upload und wähle dein Dokument vom Computer aus.

'Eintrag erstellen' klicken

Das System lädt die Datei hoch und beginnt mit der Verarbeitung.Das Item wird orange während der Verarbeitung und grün, sobald es einsatzbereit ist.

Verarbeitungsdetails

Das System verwendet fortschrittliche Dokumentenanalyse, um Text aus hochgeladenen Dateien zu extrahieren:

Textextraktion – Bei textbasierten PDFs und Word-Dokumenten wird der Inhalt direkt extrahiert
OCR (Optical Character Recognition) – Technologie, die Text aus gescannten Bildern liest – Die Plattform verarbeitet gescannte Dokumente und Bilder in PDFs mit OCR
Chunking – Extrahierter Inhalt wird in Chunks für die Vektorindexierung aufgeteilt (Inhalt für semantische Suche vorbereiten), um Retrieval zu ermöglichen

Dateispezifikationen:

Formate: PDF, Word (.doc, .docx), Excel (.xlsx), Text (.txt, .log), Markdown (.md), CSV/TSV (Datenformate), JSON (Datenformate), YAML (.yaml, .yml) (Datenformate), XML (Datenformate)
Größenlimit: maximal 10 MB
Inhalt: Textbasierte Dokumente und gescannte Bilder (erweiterte Analyse verarbeitet die meisten Scans)
Schutz: Kein Passwortschutz

Die Verarbeitung kann je nach Dateigröße und Analyseschwierigkeitsgrad bis zu mehreren Minuten dauern.

Best Practices

Vor dem Upload optimieren

Große Dateien komprimieren
Unnötige Bilder entfernen
Wenn möglich, textbasierte Dokumente verwenden
Unter 5 MB halten für schnellere Verarbeitung

Extraktion testen

Extrahierten Inhalt nach der Verarbeitung prüfen
Auf Formatierungsprobleme achten
Korrektheit kritischer Informationen verifizieren
Bei schlechter Extraktion neu hochladen

Einschränkungen

Maximale Dateigröße von 10 MB
Passwortgeschützte Dateien können nicht verarbeitet werden
Sehr schlechte Scans können unvollständigen oder ungenauen Text erzeugen
Komplexe Layouts (mehrspaltig, aufwendige Tabellen) werden möglicherweise nicht perfekt extrahiert – extrahierten Inhalt prüfen und bei Bedarf in Text-Items umwandeln

Fehlerbehebung

Verarbeitung fehlgeschlagen

Ursachen:

Datei überschreitet 10 MB
Datei ist passwortgeschützt
Datei ist beschädigt
Sehr schlechte Qualität gescannter Bilder

Lösungen:

Datei komprimieren oder in kleinere Dateien aufteilen
Passwortschutz entfernen
Datei aus der Quelle neu exportieren
Bei sehr schlechten Scans Inhalt in ein Text-Item kopieren

Inhalt falsch extrahiert

Ursachen:

Komplexe Layouts (mehrspaltiger Satz, Tabellen)
Sehr schlechte Qualität gescannter Bilder
Spezielle Schriftarten oder Zeichenkodierungen
Formularfelder und interaktive Elemente

Lösungen:

Extrahierten Inhalt im Bearbeitungsmodus prüfen
Als Text-Item mit korrekter Formatierung neu erstellen
Dokumentenlayout vor dem Hochladen vereinfachen
Als reines Textdokument exportieren

Verarbeitung dauert zu lang

Vorgehen:

5–10 Minuten warten, bevor ein Fehler angenommen wird
Dateigröße und Seitenanzahl prüfen
Für große Dateien in mehrere Dateien aufteilen
In Text konvertieren und als TEXT-Items hochladen

URL-Items

Was sind URL-Items?

URL-Items scrapen den Inhalt einer einzelnen Webseite und speichern ihn in deiner Wissensdatenbank. Das ist nützlich, um auf eine bestimmte Online-Dokumentationsseite, einen Hilfe-Artikel oder einen Blog-Beitrag zu verweisen.

Wie du ein URL-Item hinzufügst

Zum Ordner navigieren

Öffne den Ordner, in dem du die URL hinzufügen möchtest.

'Eintrag hinzufügen' klicken

Klicke auf Eintrag hinzufügen, um ein neues Item zu erstellen.

'Webseite' wählen

Wähle Webseite aus den Inhaltstyp-Optionen.

Titel eingeben

Gib dem Inhalt einen beschreibenden Titel.

Quell-URL eingeben

Füge die vollständige URL inklusive https:// einBeispiel:

https://docs.company.com/api/authentication

'Eintrag erstellen' klicken

Das System ruft die Webseite ab und verarbeitet sie.Das Item wird orange während der Verarbeitung und grün, sobald es einsatzbereit ist.

Verarbeitungsdetails

Wenn du ein URL-Item hinzufügst, führt das System folgendes durch:

Abrufen der Seite unter der angegebenen URL
Extrahieren des Haupttextinhalts, wobei Navigation, Werbung und Boilerplate entfernt werden
Speichern des extrahierten Texts als Inhalt des Wissenseintrags
Indexieren des Inhalts für die Vektorsuche, genau wie bei Text- und Datei-Items

Das System scrapt Inhalt einmalig bei der Erstellung. Zum Aktualisieren das URL-Item löschen und neu erstellen.

Best Practices

Erreichbarkeit prüfen

URL zuerst im Inkognito-Fenster öffnen
Prüfen, ob kein Login erforderlich ist
Sicherstellen, dass Inhalt ohne JavaScript sichtbar ist
Sicherstellen, dass die Seite schnell lädt

Gescrapten Inhalt prüfen

Inhalt nach dem Scraping prüfen
Verifizieren, dass der richtige Inhalt erfasst wurde
Auf Formatierungsprobleme achten
Sicherstellen, dass kein Zusatzinhalt (Werbung, Seitenleisten) aufgenommen wurde

Einschränkungen

Authentifizierung – Seiten mit Login-Anforderung können nicht gescrapt werden
JavaScript-intensive Seiten – Single-Page-Applications und dynamisch geladener Inhalt werden möglicherweise nicht erfasst
Bezahlschranken – Inhalt hinter Paywalls ist nicht zugänglich
Kein automatisches Aktualisieren – Inhalt wird einmalig gescrapt; das Item muss neu erstellt werden, um es zu aktualisieren
robots.txt (eine Datei, mit der Websites den automatisierten Zugriff steuern) – Websites, die Scraping blockieren, schlagen fehl

URL-Scraping funktioniert am besten mit einfachen, textbasierten Webseiten. Wenn das Scraping fehlschlägt oder unvollständigen Inhalt liefert, kopiere den Inhalt stattdessen manuell in ein Text-Item.

Fehlerbehebung

Scraping fehlgeschlagen

Ursachen:

Seite erfordert Login/Authentifizierung
URL ist falsch oder defekt
Inhalt wird per JavaScript geladen
Website blockiert Scraping (robots.txt)
Seite existiert nicht (404)

Lösungen:

Prüfen, ob URL öffentlich zugänglich ist
URL im Inkognito-Browserfenster testen
Prüfen, ob URL vollständig und korrekt ist
Inhalt manuell in Text-Item kopieren
Seite stattdessen als PDF exportieren und hochladen

Inhalt unvollständig oder falsch

Ursachen:

JavaScript-gerenderter Inhalt nicht erfasst
Dynamisch geladener Inhalt
Mehrere Tabs/Abschnitte auf der Seite
Kommentare oder Seitenleisten statt Hauptinhalt gescrapt

Lösungen:

Gescrapten Inhalt im Bearbeitungsmodus prüfen
Direkte URL zu einem bestimmten Inhaltsabschnitt verwenden
Gewünschten Inhalt in Text-Item kopieren
Seite als PDF exportieren und stattdessen hochladen

Inhalt veraltet

Lösung: Einzelseiten-URL-Inhalt wird einmalig bei der Erstellung gescrapt. Zum Aktualisieren:

URL-Item löschen und neu erstellen
Oder aktuellen Inhalt in ein Text-Item kopieren für manuelle Aktualisierungen

Für häufig ändernde Inhalte erwägen:

Manuelle Text-Items, die du regelmäßig aktualisierst
PDF-Exporte, die du regelmäßig aktualisierst

Website-Crawl-Items

Was sind Website-Crawl-Items?

Website-Crawl-Items entdecken mehrere öffentliche Seiten einer Website und importieren die von dir ausgewählten Seiten. Verwende diesen Typ, wenn eine Wissensquelle mehrere URLs umfasst, wie etwa ein Help Center oder eine Dokumentations-Website.

Wie du einen Website-Crawl hinzufügst

Zum Ordner navigieren

Öffne den Ordner, in dem du den Crawl hinzufügen möchtest.

'Eintrag hinzufügen' klicken

Klicke auf Eintrag hinzufügen, um ein neues Item zu erstellen.

'Website-Crawl' wählen

Wähle Website-Crawl aus den Inhaltstyp-Optionen.

Website-URL eingeben

Füge die Website-URL ein und klicke auf URLs entdecken.

Seiten auswählen

Prüfe die entdeckten Seiten, wähle die gewünschten aus und klicke auf Ausgewählte importieren.

Crawl-Einstellungen

Öffne Erweiterte Optionen vor der Entdeckung, um den Crawl-Umfang und das Aktualisierungsverhalten zu steuern.

UI-Einstellung	Standard	Was sie steuert	Wann ändern
Max pages to discover	`100`	Die maximale Anzahl von URLs, die von der Startseite entdeckt werden. Verfügbare Werte sind `25`, `50`, `100`, `250` und `500`. Dies begrenzt nur die Entdeckung; du wählst weiterhin selbst aus, welche entdeckten Seiten importiert werden.	Verringern für kleine Websites oder schnelle Tests. Erhöhen für größere Help Center oder Dokumentations-Websites.
Auto-refresh interval	`Never`	Wie oft das System bereits importierte Seiten neu synchronisiert. Optionen sind `Never`, `Every 24 hours`, `Every 7 days` und `Every 30 days`.	`Every 7 days` oder `Every 30 days` für öffentliche Dokumentationen, Preisseiten, Richtlinien oder Help-Center-Seiten verwenden, die sich im Laufe der Zeit ändern.
Include subdomains	Aus	Ob bei der Entdeckung auch Seiten unter Subdomains des Starthosts berücksichtigt werden. Bei Start von `docs.example.com` sind damit Hosts wie `api.docs.example.com` erlaubt; Geschwister-Domains wie `help.example.com` sind nicht eingeschlossen.	Nur aktivieren, wenn die zu importierende Website auf mehrere Subdomains desselben Hosts verteilt ist.
Neue Seiten bei Aktualisierung erkennen	Aus, ausgeblendet wenn das Aktualisierungsintervall auf `Nie` steht	Wenn Aktualisieren aktiviert ist, kann das System die Entdeckung erneut ausführen und neu gefundene Seiten zur Prüfung bereitstellen. Neu entdeckte Seiten werden nicht automatisch eingeschlossen.	Aktivieren, wenn die Website regelmäßig neue Seiten hinzufügt und du diese über Seiten anzeigen prüfen möchtest.

Nach dem Import erscheint das Website-Stammverzeichnis als Website-Eintrag. Nutze Seiten anzeigen, um einzelne Seiten ein- oder auszuschließen, URLs innerhalb der Crawl-Domain hinzuzufügen, Seiten neu zu entdecken oder Seiteninhalte neu zu synchronisieren. Unter Seiten anzeigen kannst du das Aktualisierungsintervall und das automatische Entdeckungsverhalten aktualisieren; die ursprüngliche Seitenanzahl und der Subdomain-Umfang werden bei der Entdeckung festgelegt.

Einschränkungen

Öffentliche Seiten funktionieren am besten; authentifizierungspflichtige Seiten werden nicht unterstützt
JavaScript-intensive Seiten werden möglicherweise nicht sauber extrahiert
Crawls zählen zum Wissensdatenbank-Limit für URL-/Website-Items
Importierte Seiten müssen zunächst die Inhaltsverarbeitung und Vektorindexierung erfolgreich abschließen, bevor RAG sie abrufen kann

Verarbeitungs-Status-Flow

Wissenseinträge durchlaufen zwei separate Verarbeitungs-Pipelines:

Inhaltsverarbeitung – Text aus Dateien, URLs und Website-Seiten extrahieren
Vektorindexierung – Inhalt für RAG (semantische Suche) vorbereiten

Verarbeitungsstatus

Orange bedeutet, dass das Item noch verarbeitet wird. Grün bedeutet, es ist einsatzbereit. Wenn ein Item einen Fehler anzeigt, klicke auf Reindex, um es erneut zu versuchen.

Den richtigen Inhaltstyp wählen

Deine Situation	Bester Inhaltstyp
FAQs von Grund auf schreiben	TEXT
Vorhandene Word-/PDF-Dokumente unter 10 MB	FILE
Dokumente über 10 MB	In kleinere Dateien aufteilen oder in TEXT extrahieren
Eine einzelne öffentliche Webseite	URL (mit TEXT als Backup)
Mehrseitige öffentliche Dokumentation oder Help Center	Website-Crawl
Private/authentifizierungspflichtige Inhalte	In TEXT kopieren
Sofortige Verfügbarkeit benötigt	TEXT (keine Verarbeitungsverzögerung)
Komplexe Formatierung ist wichtig	FILE

Nächste Schritte

Kontext vs. RAG

Erfahre, wie Agenten auf deine Wissensinhalte zugreifen

Wissensdatenbanken erstellen

Schritt-für-Schritt-Anleitung zur Erstellung folgen

Architektur-Übersicht

Struktur der Wissensdatenbank verstehen

Template-Syntax

Wissen im Agenten-Prompt referenzieren

Erste Schritte

Erstellen

Testen

Deploy

Verwalten

Beispiele

Fehlerbehebung

Referenz

Account-Administration

Entwickler & Integrationen

Abrechnung & Nutzung

Partner-Netzwerk

​Unterstützte Inhaltstypen

Text-Items

Datei-Uploads

URL-Scraping

Website-Crawl

​Text-Items

​Was sind Text-Items?

​Wie du ein Text-Item hinzufügst

​Best Practices

Für Retrieval strukturieren

Beschreibende Titel verwenden

​Wann du Text-Items nutzen solltest

​Einschränkungen

​Datei-Upload-Items

​Was sind Datei-Upload-Items?

​Wie du ein Datei-Item hinzufügst

​Verarbeitungsdetails

​Best Practices

Vor dem Upload optimieren

Extraktion testen

​Einschränkungen

​Fehlerbehebung

​URL-Items

​Was sind URL-Items?

​Wie du ein URL-Item hinzufügst

​Verarbeitungsdetails

​Best Practices

Erreichbarkeit prüfen

Gescrapten Inhalt prüfen

​Einschränkungen

​Fehlerbehebung

​Website-Crawl-Items

​Was sind Website-Crawl-Items?

​Wie du einen Website-Crawl hinzufügst

​Crawl-Einstellungen

​Einschränkungen

​Verarbeitungs-Status-Flow

​Verarbeitungsstatus

​Den richtigen Inhaltstyp wählen

​Nächste Schritte

Kontext vs. RAG

Wissensdatenbanken erstellen

Architektur-Übersicht

Template-Syntax

Unterstützte Inhaltstypen

Text-Items

Was sind Text-Items?

Wie du ein Text-Item hinzufügst

Best Practices

Wann du Text-Items nutzen solltest

Einschränkungen

Datei-Upload-Items

Was sind Datei-Upload-Items?

Wie du ein Datei-Item hinzufügst

Verarbeitungsdetails

Best Practices

Einschränkungen

Fehlerbehebung

URL-Items

Was sind URL-Items?

Wie du ein URL-Item hinzufügst

Verarbeitungsdetails

Best Practices

Einschränkungen

Fehlerbehebung

Website-Crawl-Items

Was sind Website-Crawl-Items?

Wie du einen Website-Crawl hinzufügst

Crawl-Einstellungen

Einschränkungen

Verarbeitungs-Status-Flow

Verarbeitungsstatus

Den richtigen Inhaltstyp wählen

Nächste Schritte