Zum Hauptinhalt springen

Zwei Zugriffsarten

Wenn du Knowledge an deinen Agenten zuweist, musst du entscheiden, wie der Agent auf diese Informationen zugreift. Wenn du noch keine Wissensdatenbank erstellt hast, starte mit dem Leitfaden Wissensdatenbanken erstellen. itellicoAI bietet zwei Zugriffsarten: Context Mode (Prompt Injection) und RAG Mode (RAG: Retrieval-Augmented Generation - ein Suchsystem, das nur die relevantesten Informationen findet, die dein Agent braucht).

Schnelle Entscheidung

Verwende Context, wenn…Verwende RAG, wenn…
Inhalte klein sind (unter ein paar Tausend Wörter)Inhalte groß sind (FAQs, Kataloge, vollständige Doku)
Der Agent sie bei jedem Anruf brauchtDer Agent sie nur für bestimmte Fragen braucht
Du keine Retrieval-Latenz möchtestDu breite Abdeckung über viele Themen brauchst
Beispiele: Preistabelle, Öffnungszeiten, RückgaberegelungBeispiele: Produktkatalog, komplette FAQ-Bibliothek, Support-Doku
Unsicher? Starte mit RAG. Das ist für die meisten Anwendungsfälle sicherer. Wechsle zu Context nur für kleine Inhalte, die immer gebraucht werden.

Die zwei Zugriffsarten

Kontext-Modus

Prompt InjectionAlle Knowledge wird direkt zu Beginn jeder Interaktion in den Conversation-Context des Agenten injiziert (neben deinem Prompt).Am besten für: Kleine Wissensdatenbanken mit kritischen Informationen, die der Agent für jedes Gespräch braucht.

RAG Mode

RAG (Retrieval-Augmented Generation)Der Agent durchsucht und ruft relevante Knowledge dynamisch auf Basis des Gesprächsthemas ab.Am besten für: Größere Wissensdatenbanken, bei denen pro Gespräch nur bestimmte Abschnitte benötigt werden.

Context Mode (Prompt Injection)

Wie es funktioniert

Im Context Mode lädt die Plattform deine Wissensdatenbank-Inhalte zu Beginn jedes Gesprächs direkt in den System-Prompt des Agenten:
System Prompt:
You are a helpful customer service agent.

[Your agent instructions...]

==== KNOWLEDGE BASE: Customer Support FAQ ====

### Billing & Payments
- Question: How do I update my payment method?
  Answer: You can update your payment method by...

- Question: When will I be billed?
  Answer: Billing occurs on the same day each month...

### Return Policy
[Full return policy content]

### Shipping Information
[Full shipping information]

==== END KNOWLEDGE BASE ====

Now assist the customer with their question.
Der Agent sieht ALLE Knowledge-Inhalte von Anfang an und kann während des Gesprächs darauf verweisen.

Formatierte Ausgabe

Standardmäßig injiziert das System Knowledge mit strukturierter Formatierung:
========================================
# Wissensdatenbank Name
Knowledge base description

## Folder Name
Folder description

### Item Title
----------------------------------------
Item content here
----------------------------------------
========================================
Dieses Format hilft dem Agenten, Struktur und Organisation der Knowledge zu verstehen.

Wann Context Mode sinnvoll ist

Wenn dein Inhalt kompakt ist und der Agent ihn bei jedem Anruf braucht, stellt Context Mode sicher, dass er immer verfügbar ist.Beispiel-Use-Case: Ein Support-Agent mit einer Wissensdatenbank, die enthält:
  • 10 häufige FAQs
  • Rückgaberegelung
  • Kontaktinformationen
  • Versandoptionen
Informationen, auf die der Agent bei den meisten oder allen Anrufen verweisen muss.Beispiel-Use-Case: Ein Booking-Agent, der braucht:
  • Unternehmensrichtlinien (immer)
  • Verfügbare Services (immer)
  • Preisstruktur (immer)
  • Buchungsprozesse (immer)
Wenn Wissenseinträge aufeinander verweisen oder ein in sich geschlossenes Ganzes bilden.Beispiel-Use-Case: Produktkonfigurations-Agent mit:
  • Abhängigkeiten bei Optionen (“Wenn X gewählt wird, Y anbieten”)
  • Kompatibilitätsmatrix
  • Paket-Bundles
  • Preise, die von Kombinationen abhängen

Vorteile des Context Mode

Immer verfügbar

Sofortiger Zugriff auf alle Knowledge ohne Suchverzögerung

Besser für kleine Mengen

Kleine Knowledge-Sets effizient im Kontextfenster verarbeiten

Deterministisch

Liefert jedes Mal genau dieselbe Knowledge

Funktioniert mit Variablen

Jinja-Variablen einbinden, die zur Laufzeit aufgelöst werden

Einschränkungen des Context Mode

Context Mode ist insgesamt auf 10,000 Tokens (ungefähr 7,500 Wörter) begrenzt über alle zugewiesenen Knowledge-Quellen.
Trade-offs:
  • Alle Context-Mode-Inhalte werden mit jeder Anfrage gesendet, also bedeuten mehr Inhalte höheren Kosten- und Latenzaufwand
  • Die gesamte Wissensdatenbank wird einbezogen, auch wenn nur ein kleiner Teil für diesen Anruf relevant ist
  • Am besten für Inhalte mit wenigen Tausend Wörtern oder weniger - nutze RAG für größere Mengen

RAG Mode (Retrieval-Augmented Generation)

Wie es funktioniert

Im RAG Mode speichert die Plattform deine Wissensdatenbank in einer Vektordatenbank. Wenn der Agent Informationen braucht:
  1. Nutzer fragt: “Wie lautet eure Rückgaberegelung?”
  2. Agent erkennt den Bedarf: Der Agent stellt fest, dass er Wissen zu Rückgaben braucht
  3. System sucht: Das RAG-System durchsucht die Wissensdatenbank nach relevanten Inhalten
  4. Relevante Inhalte werden abgerufen: Nur der Abschnitt zur Rückgabe wird geholt
  5. Agent antwortet: Der Agent nutzt das abgerufene Wissen für die Antwort
Der Agent sieht nur die Knowledge, die er braucht, und zwar dann, wenn er sie braucht.

Intelligentes Retrieval

RAG nutzt semantische Suche mit Vektor-Embeddings, um relevante Knowledge zu finden:
User: "I need to send back the shoes I bought last week"

RAG System thinks:
- Keywords: "send back", "shoes", "bought"
- Semantic meaning: Returns, possibly exchange
- Search knowledge for: return policy, shipping, exchanges

Retrieved knowledge:
- Return Policy Overview
- Return Shipping Instructions
- Exchange Procedures

NOT retrieved:
- Billing FAQ
- Product Specifications
- Account Management

Vorteile des RAG Mode

Skaliert über den Kontext hinaus

Unterstützt größere Wissensdatenbanken ohne die 10,000-Token-Context-Grenze

Schneller für große Knowledge

Reduziert die System-Prompt-Tokens für große Wissensdatenbanken

Effizient

Holt nur das, was für das aktuelle Thema gebraucht wird

Besser für Vielfalt

Behandelt viele unterschiedliche Themen gut

Wichtige Punkte beim RAG Mode

RAG hängt von der Suchgenauigkeit ab. Wenn deine Wissenseinträge nicht klar geschrieben sind, kann Retrieval relevante Informationen verpassen.
Die Retrieval-Qualität hängt ab von:
  • klaren, beschreibenden Titeln für Wissenseinträge
  • gut strukturiertem Inhalt
  • sinnvoller Kategorisierung in Ordnern
  • dem Vermeiden doppelter oder widersprüchlicher Informationen

Den richtigen Modus wählen

Nutze diesen Entscheidungsleitfaden, um die beste Zugriffsart zu wählen:

Hybrid-Ansatz

Du kannst beide Modi für verschiedene Wissensdatenbanken am selben Agenten nutzen: Beispielkonfiguration:
  • Context Mode: Kleine Wissensdatenbank “Core Policies” (immer benötigt)
  • RAG Mode: Große Wissensdatenbank “Product Catalog” (bei Bedarf abrufen)
Das kombiniert die Stärken beider Methoden.

Deine Konfiguration testen

1

Wissensdatenbank zuweisen

Konfiguriere deinen Agenten mit einer Wissensdatenbank im Context- oder RAG-Mode.
2

Test starten

Nutze das Test-Agent-Menü für einen Chat-, Web- oder Phone-Call.
3

Nach Knowledge-Inhalten fragen

Stelle Fragen, die aus deiner Wissensdatenbank beantwortet werden sollten.Beispielfragen:
  • “Wie lautet eure Rückgaberegelung?”
  • “Wie viel kostet der Pro-Plan?”
  • “Wie sind eure Öffnungszeiten?”
4

Antworten prüfen

Bestätige, dass der Agent Knowledge-Inhalte korrekt in den Antworten verwendet.
5

Edge Cases testen

Frage nach Themen, die nicht in deiner Wissensdatenbank enthalten sind, um sicherzustellen, dass der Agent angemessen reagiert (“Ich habe diese Information nicht”).

Best Practices

Wenn du unsicher bist, nutze RAG Mode. Das ist für große Wissensdatenbanken sicherer, und du kannst später immer noch zu Context Mode wechseln.
RAG verwendet semantische Suche, um relevante Knowledge zu finden. Schreibe vollständige, gut formulierte Inhalte, die natürlich die Begriffe und Konzepte enthalten, nach denen Nutzer fragen werden.Gut: “Our return policy allows returns within 30 days of purchase for physical products. Digital products cannot be returned once downloaded.”Schlecht: “See policy doc” oder unvollständige Satzfragmente
Probiere Context und RAG Mode mit deiner Wissensdatenbank aus und schau, welcher für deinen Anwendungsfall besser funktioniert.
Nutze Context Mode für kritische, häufig benötigte Infos und RAG Mode für umfangreiches Referenzmaterial.

Fehlerbehebung

Prüfen:
  • Sind alle Wissenseinträge grün (ready to use)?
  • Reicht der verbleibende Kontext (nicht abgeschnitten)?
Lösung:
  • Fehlgeschlagene Items beheben
  • Knowledge verkleinern oder zu RAG wechseln
Prüfen:
  • Ist der Inhalt gut organisiert?
  • Fragst du nach Themen, die zur Knowledge passen?
Lösung:
  • Detailliertere Inhalte hinzufügen
  • Mit anderer Formulierung testen
  • Keywords in den Inhalt aufnehmen
Prüfen:
  • Sind die Knowledge-Inhalte korrekt und aktuell?
  • Gibt es widersprüchliche Informationen in mehreren Items?
Lösung:
  • Knowledge-Inhalte aktualisieren
  • Duplikate und Widersprüche entfernen
Lösungen:
  • Für große Wissensdatenbanken auf RAG Mode wechseln
  • Knowledge in kleinere, fokussierte Bases aufteilen
  • Prompt-Länge des Agenten reduzieren
  • Ausführliche oder redundante Inhalte entfernen

Nächste Schritte

Wissensdatenbanken erstellen

Wissensinhalte aufbauen und organisieren

Inhaltstypen

Mehr über Text-, Datei-, URL- und Website-Crawl-Items erfahren

Template-Syntax

Knowledge-Referenzen im Prompt verwenden

Agent testen

Testen, wie dein Agent Knowledge nutzt