Zum Hauptinhalt springen

Unterstützte Inhaltstypen

itellicoAI unterstützt vier Typen von Wissenseinträgen, die jeweils für unterschiedliche Inhaltsquellen und Anwendungsfälle konzipiert sind. Das Verständnis der Funktionsweise jedes Typs hilft dir, das richtige Format für deine Informationen zu wählen. Hinweise zur Organisation dieser Einträge findest du unter Wissensdatenbank-Architektur.

Text-Items

Inhalt direkt über den integrierten Editor eingeben

Datei-Uploads

PDF-, Word-, Excel-, Text-, Markdown-, CSV-, JSON-, YAML- und XML-Dateien bis 10 MB hochladen

URL-Scraping

Inhalt von einer einzelnen Webseite abrufen

Website-Crawl

Mehrere Seiten einer öffentlichen Website entdecken und importieren

Text-Items

Was sind Text-Items?

Text-Items sind Inhalte, die du direkt in den itellicoAI-Wissensdatenbank-Editor eingibst. Sie sind der unkomplizierteste und zuverlässigste Inhaltstyp – sofort verfügbar ohne Verarbeitungsverzögerung.

Wie du ein Text-Item hinzufügst

1

Zum Ordner navigieren

Öffne den Ordner, in dem du das Item hinzufügen möchtest.
2

'Eintrag hinzufügen' klicken

Klicke auf Eintrag hinzufügen, um ein neues Item zu erstellen.
3

'Textinhalt' wählen

Wähle Textinhalt aus den Inhaltstyp-Optionen.
4

Titel eingeben

Gib deinem Item einen klaren, beschreibenden Titel.
5

Inhalt schreiben

Gib deinen Inhalt in den Editor ein. Nutze Formatierung für mehr Klarheit:
  • Überschriften für Abschnitte
  • Aufzählungspunkte für Listen
  • Nummern für Schrittfolgen
  • Fettschrift für Hervorhebungen
6

'Eintrag erstellen' klicken

Speichere dein Text-Item. Es wird sofort grün.

Best Practices

Für Retrieval strukturieren

Schreibe Inhalt in klaren, in sich geschlossenen Abschnitten. Jeder Abschnitt sollte eine spezifische Frage beantworten, damit RAG (Retrieval-Augmented Generation) fokussierte Ergebnisse zurückgibt.

Beschreibende Titel verwenden

Verbessere Organisation und Retrieval-Genauigkeit mit klaren Namen wie “Rückgaberichtlinie – Digitale Produkte” statt “Richtlinie 4”.

Wann du Text-Items nutzen solltest

Erstelle Frage-und-Antwort-Paare direkt im System.Beispiel:
Title: How do I reset my password?

Content:
To reset your password:

1. Go to the login page
2. Click "Forgot Password"
3. Enter your email address
4. Check your email for a reset link
5. Click the link and create a new password

Password requirements:
- Minimum 8 characters
- At least one uppercase letter
- At least one number
- At least one special character

If you don't receive the email within 5 minutes, check your spam
folder or contact support@company.com.
Schreibe klare, prägnante Richtlinienaussagen.Beispiel:
Title: Return Policy - Digital Products

Content:
Digital products can be refunded within 30 days of purchase if:

Eligible for refund:
- Product has a technical defect preventing usage
- Product description was materially inaccurate
- Customer has not accessed or downloaded the product

Not eligible for refund:
- Change of mind after accessing the product
- Compatibility issues disclosed in product description
- User error or misunderstanding of features

To request a refund:
Email support@company.com with your order number and reason
for the refund request.

Processing time: 5-7 business days
Refund method: Original payment method
Schritt-für-Schritt-Anweisungen für Prozesse.Beispiel:
Title: Order Modification Process

Content:
Customers can modify orders within 24 hours of placement.

What can be modified:
- Shipping address
- Delivery speed
- Item quantities (if inventory available)

What cannot be modified:
- Payment method (must cancel and reorder)
- Items after processing has begun
- Orders placed more than 24 hours ago

Modification process:
1. Customer contacts support via phone or email
2. Agent verifies order is within modification window
3. Agent checks inventory for requested changes
4. Agent updates order in system
5. Customer receives confirmation email

If order has already shipped, customer must use return process instead.
Kurze, häufig benötigte Informationen.Beispiel:
Title: Business Hours & Contact Information

Content:
Customer Support:
- Phone: 1-800-555-0123
- Email: support@company.com
- Hours: Monday-Friday, 9 AM - 6 PM EST
- After-hours: emergency@company.com (urgent issues only)

Sales:
- Phone: 1-800-555-0124
- Email: sales@company.com
- Hours: Monday-Friday, 8 AM - 8 PM EST

Billing:
- Phone: 1-800-555-0125
- Email: billing@company.com
- Hours: Monday-Friday, 9 AM - 5 PM EST

Einschränkungen

  • Keine Dateianhänge möglich – Inhalt muss getippt oder eingefügt werden
  • Große Inhaltsmengen lassen sich besser als Datei-Uploads verwalten
Text-Items sind der zuverlässigste Inhaltstyp. Gib Inhalt wenn möglich als Text ein, anstatt Dateien hochzuladen.

Datei-Upload-Items

Was sind Datei-Upload-Items?

Datei-Upload-Items ermöglichen das Hochladen bestehender Dokumente in verschiedenen Formaten. Das System extrahiert den Textinhalt und stellt ihn deinen Agenten zur Verfügung.

Wie du ein Datei-Item hinzufügst

1

Zum Ordner navigieren

Öffne den Ordner, in dem du die Datei hinzufügen möchtest.
2

'Eintrag hinzufügen' klicken

Klicke auf Eintrag hinzufügen, um ein neues Item zu erstellen.
3

'Datei hochladen' wählen

Wähle Datei hochladen aus den Inhaltstyp-Optionen.
4

Titel eingeben

Gib deiner Datei einen beschreibenden Titel (dieser ist vom Dateinamen unabhängig).
5

Datei hochladen

Klicke auf Upload und wähle dein Dokument vom Computer aus.
6

'Eintrag erstellen' klicken

Das System lädt die Datei hoch und beginnt mit der Verarbeitung.Das Item wird orange während der Verarbeitung und grün, sobald es einsatzbereit ist.

Verarbeitungsdetails

Das System verwendet fortschrittliche Dokumentenanalyse, um Text aus hochgeladenen Dateien zu extrahieren:
  • Textextraktion – Bei textbasierten PDFs und Word-Dokumenten wird der Inhalt direkt extrahiert
  • OCR (Optical Character Recognition) – Technologie, die Text aus gescannten Bildern liest – Die Plattform verarbeitet gescannte Dokumente und Bilder in PDFs mit OCR
  • Chunking – Extrahierter Inhalt wird in Chunks für die Vektorindexierung aufgeteilt (Inhalt für semantische Suche vorbereiten), um Retrieval zu ermöglichen
Dateispezifikationen:
  • Formate: PDF, Word (.doc, .docx), Excel (.xlsx), Text (.txt, .log), Markdown (.md), CSV/TSV (Datenformate), JSON (Datenformate), YAML (.yaml, .yml) (Datenformate), XML (Datenformate)
  • Größenlimit: maximal 10 MB
  • Inhalt: Textbasierte Dokumente und gescannte Bilder (erweiterte Analyse verarbeitet die meisten Scans)
  • Schutz: Kein Passwortschutz
Die Verarbeitung kann je nach Dateigröße und Analyseschwierigkeitsgrad bis zu mehreren Minuten dauern.

Best Practices

Vor dem Upload optimieren

  • Große Dateien komprimieren
  • Unnötige Bilder entfernen
  • Wenn möglich, textbasierte Dokumente verwenden
  • Unter 5 MB halten für schnellere Verarbeitung

Extraktion testen

  • Extrahierten Inhalt nach der Verarbeitung prüfen
  • Auf Formatierungsprobleme achten
  • Korrektheit kritischer Informationen verifizieren
  • Bei schlechter Extraktion neu hochladen

Einschränkungen

  • Maximale Dateigröße von 10 MB
  • Passwortgeschützte Dateien können nicht verarbeitet werden
  • Sehr schlechte Scans können unvollständigen oder ungenauen Text erzeugen
  • Komplexe Layouts (mehrspaltig, aufwendige Tabellen) werden möglicherweise nicht perfekt extrahiert – extrahierten Inhalt prüfen und bei Bedarf in Text-Items umwandeln

Fehlerbehebung

Ursachen:
  • Datei überschreitet 10 MB
  • Datei ist passwortgeschützt
  • Datei ist beschädigt
  • Sehr schlechte Qualität gescannter Bilder
Lösungen:
  • Datei komprimieren oder in kleinere Dateien aufteilen
  • Passwortschutz entfernen
  • Datei aus der Quelle neu exportieren
  • Bei sehr schlechten Scans Inhalt in ein Text-Item kopieren
Ursachen:
  • Komplexe Layouts (mehrspaltiger Satz, Tabellen)
  • Sehr schlechte Qualität gescannter Bilder
  • Spezielle Schriftarten oder Zeichenkodierungen
  • Formularfelder und interaktive Elemente
Lösungen:
  • Extrahierten Inhalt im Bearbeitungsmodus prüfen
  • Als Text-Item mit korrekter Formatierung neu erstellen
  • Dokumentenlayout vor dem Hochladen vereinfachen
  • Als reines Textdokument exportieren
Vorgehen:
  • 5–10 Minuten warten, bevor ein Fehler angenommen wird
  • Dateigröße und Seitenanzahl prüfen
  • Für große Dateien in mehrere Dateien aufteilen
  • In Text konvertieren und als TEXT-Items hochladen

URL-Items

Was sind URL-Items?

URL-Items scrapen den Inhalt einer einzelnen Webseite und speichern ihn in deiner Wissensdatenbank. Das ist nützlich, um auf eine bestimmte Online-Dokumentationsseite, einen Hilfe-Artikel oder einen Blog-Beitrag zu verweisen.

Wie du ein URL-Item hinzufügst

1

Zum Ordner navigieren

Öffne den Ordner, in dem du die URL hinzufügen möchtest.
2

'Eintrag hinzufügen' klicken

Klicke auf Eintrag hinzufügen, um ein neues Item zu erstellen.
3

'Webseite' wählen

Wähle Webseite aus den Inhaltstyp-Optionen.
4

Titel eingeben

Gib dem Inhalt einen beschreibenden Titel.
5

Quell-URL eingeben

Füge die vollständige URL inklusive https:// einBeispiel:
https://docs.company.com/api/authentication
6

'Eintrag erstellen' klicken

Das System ruft die Webseite ab und verarbeitet sie.Das Item wird orange während der Verarbeitung und grün, sobald es einsatzbereit ist.

Verarbeitungsdetails

Wenn du ein URL-Item hinzufügst, führt das System folgendes durch:
  1. Abrufen der Seite unter der angegebenen URL
  2. Extrahieren des Haupttextinhalts, wobei Navigation, Werbung und Boilerplate entfernt werden
  3. Speichern des extrahierten Texts als Inhalt des Wissenseintrags
  4. Indexieren des Inhalts für die Vektorsuche, genau wie bei Text- und Datei-Items
Das System scrapt Inhalt einmalig bei der Erstellung. Zum Aktualisieren das URL-Item löschen und neu erstellen.

Best Practices

Erreichbarkeit prüfen

  • URL zuerst im Inkognito-Fenster öffnen
  • Prüfen, ob kein Login erforderlich ist
  • Sicherstellen, dass Inhalt ohne JavaScript sichtbar ist
  • Sicherstellen, dass die Seite schnell lädt

Gescrapten Inhalt prüfen

  • Inhalt nach dem Scraping prüfen
  • Verifizieren, dass der richtige Inhalt erfasst wurde
  • Auf Formatierungsprobleme achten
  • Sicherstellen, dass kein Zusatzinhalt (Werbung, Seitenleisten) aufgenommen wurde

Einschränkungen

  • Authentifizierung – Seiten mit Login-Anforderung können nicht gescrapt werden
  • JavaScript-intensive Seiten – Single-Page-Applications und dynamisch geladener Inhalt werden möglicherweise nicht erfasst
  • Bezahlschranken – Inhalt hinter Paywalls ist nicht zugänglich
  • Kein automatisches Aktualisieren – Inhalt wird einmalig gescrapt; das Item muss neu erstellt werden, um es zu aktualisieren
  • robots.txt (eine Datei, mit der Websites den automatisierten Zugriff steuern) – Websites, die Scraping blockieren, schlagen fehl
URL-Scraping funktioniert am besten mit einfachen, textbasierten Webseiten. Wenn das Scraping fehlschlägt oder unvollständigen Inhalt liefert, kopiere den Inhalt stattdessen manuell in ein Text-Item.

Fehlerbehebung

Ursachen:
  • Seite erfordert Login/Authentifizierung
  • URL ist falsch oder defekt
  • Inhalt wird per JavaScript geladen
  • Website blockiert Scraping (robots.txt)
  • Seite existiert nicht (404)
Lösungen:
  • Prüfen, ob URL öffentlich zugänglich ist
  • URL im Inkognito-Browserfenster testen
  • Prüfen, ob URL vollständig und korrekt ist
  • Inhalt manuell in Text-Item kopieren
  • Seite stattdessen als PDF exportieren und hochladen
Ursachen:
  • JavaScript-gerenderter Inhalt nicht erfasst
  • Dynamisch geladener Inhalt
  • Mehrere Tabs/Abschnitte auf der Seite
  • Kommentare oder Seitenleisten statt Hauptinhalt gescrapt
Lösungen:
  • Gescrapten Inhalt im Bearbeitungsmodus prüfen
  • Direkte URL zu einem bestimmten Inhaltsabschnitt verwenden
  • Gewünschten Inhalt in Text-Item kopieren
  • Seite als PDF exportieren und stattdessen hochladen
Lösung: Einzelseiten-URL-Inhalt wird einmalig bei der Erstellung gescrapt. Zum Aktualisieren:
  • URL-Item löschen und neu erstellen
  • Oder aktuellen Inhalt in ein Text-Item kopieren für manuelle Aktualisierungen
Für häufig ändernde Inhalte erwägen:
  • Manuelle Text-Items, die du regelmäßig aktualisierst
  • PDF-Exporte, die du regelmäßig aktualisierst

Website-Crawl-Items

Was sind Website-Crawl-Items?

Website-Crawl-Items entdecken mehrere öffentliche Seiten einer Website und importieren die von dir ausgewählten Seiten. Verwende diesen Typ, wenn eine Wissensquelle mehrere URLs umfasst, wie etwa ein Help Center oder eine Dokumentations-Website.

Wie du einen Website-Crawl hinzufügst

1

Zum Ordner navigieren

Öffne den Ordner, in dem du den Crawl hinzufügen möchtest.
2

'Eintrag hinzufügen' klicken

Klicke auf Eintrag hinzufügen, um ein neues Item zu erstellen.
3

'Website-Crawl' wählen

Wähle Website-Crawl aus den Inhaltstyp-Optionen.
4

Website-URL eingeben

Füge die Website-URL ein und klicke auf URLs entdecken.
5

Seiten auswählen

Prüfe die entdeckten Seiten, wähle die gewünschten aus und klicke auf Ausgewählte importieren.

Crawl-Einstellungen

Öffne Erweiterte Optionen vor der Entdeckung, um den Crawl-Umfang und das Aktualisierungsverhalten zu steuern.
UI-EinstellungStandardWas sie steuertWann ändern
Max pages to discover100Die maximale Anzahl von URLs, die von der Startseite entdeckt werden. Verfügbare Werte sind 25, 50, 100, 250 und 500. Dies begrenzt nur die Entdeckung; du wählst weiterhin selbst aus, welche entdeckten Seiten importiert werden.Verringern für kleine Websites oder schnelle Tests. Erhöhen für größere Help Center oder Dokumentations-Websites.
Auto-refresh intervalNeverWie oft das System bereits importierte Seiten neu synchronisiert. Optionen sind Never, Every 24 hours, Every 7 days und Every 30 days.Every 7 days oder Every 30 days für öffentliche Dokumentationen, Preisseiten, Richtlinien oder Help-Center-Seiten verwenden, die sich im Laufe der Zeit ändern.
Include subdomainsAusOb bei der Entdeckung auch Seiten unter Subdomains des Starthosts berücksichtigt werden. Bei Start von docs.example.com sind damit Hosts wie api.docs.example.com erlaubt; Geschwister-Domains wie help.example.com sind nicht eingeschlossen.Nur aktivieren, wenn die zu importierende Website auf mehrere Subdomains desselben Hosts verteilt ist.
Neue Seiten bei Aktualisierung erkennenAus, ausgeblendet wenn das Aktualisierungsintervall auf Nie stehtWenn Aktualisieren aktiviert ist, kann das System die Entdeckung erneut ausführen und neu gefundene Seiten zur Prüfung bereitstellen. Neu entdeckte Seiten werden nicht automatisch eingeschlossen.Aktivieren, wenn die Website regelmäßig neue Seiten hinzufügt und du diese über Seiten anzeigen prüfen möchtest.
Nach dem Import erscheint das Website-Stammverzeichnis als Website-Eintrag. Nutze Seiten anzeigen, um einzelne Seiten ein- oder auszuschließen, URLs innerhalb der Crawl-Domain hinzuzufügen, Seiten neu zu entdecken oder Seiteninhalte neu zu synchronisieren. Unter Seiten anzeigen kannst du das Aktualisierungsintervall und das automatische Entdeckungsverhalten aktualisieren; die ursprüngliche Seitenanzahl und der Subdomain-Umfang werden bei der Entdeckung festgelegt.

Einschränkungen

  • Öffentliche Seiten funktionieren am besten; authentifizierungspflichtige Seiten werden nicht unterstützt
  • JavaScript-intensive Seiten werden möglicherweise nicht sauber extrahiert
  • Crawls zählen zum Wissensdatenbank-Limit für URL-/Website-Items
  • Importierte Seiten müssen zunächst die Inhaltsverarbeitung und Vektorindexierung erfolgreich abschließen, bevor RAG sie abrufen kann

Verarbeitungs-Status-Flow

Wissenseinträge durchlaufen zwei separate Verarbeitungs-Pipelines:
  1. Inhaltsverarbeitung – Text aus Dateien, URLs und Website-Seiten extrahieren
  2. Vektorindexierung – Inhalt für RAG (semantische Suche) vorbereiten

Verarbeitungsstatus

Orange bedeutet, dass das Item noch verarbeitet wird. Grün bedeutet, es ist einsatzbereit. Wenn ein Item einen Fehler anzeigt, klicke auf Reindex, um es erneut zu versuchen.

Den richtigen Inhaltstyp wählen

Deine SituationBester Inhaltstyp
FAQs von Grund auf schreibenTEXT
Vorhandene Word-/PDF-Dokumente unter 10 MBFILE
Dokumente über 10 MBIn kleinere Dateien aufteilen oder in TEXT extrahieren
Eine einzelne öffentliche WebseiteURL (mit TEXT als Backup)
Mehrseitige öffentliche Dokumentation oder Help CenterWebsite-Crawl
Private/authentifizierungspflichtige InhalteIn TEXT kopieren
Sofortige Verfügbarkeit benötigtTEXT (keine Verarbeitungsverzögerung)
Komplexe Formatierung ist wichtigFILE

Nächste Schritte

Kontext vs. RAG

Erfahre, wie Agenten auf deine Wissensinhalte zugreifen

Wissensdatenbanken erstellen

Schritt-für-Schritt-Anleitung zur Erstellung folgen

Architektur-Übersicht

Struktur der Wissensdatenbank verstehen

Template-Syntax

Wissen im Agenten-Prompt referenzieren