Kontext vs. RAG-Modus

Zwei Zugriffsarten

Wenn du Knowledge an deinen Agenten zuweist, musst du entscheiden, wie der Agent auf diese Informationen zugreift. Wenn du noch keine Wissensdatenbank erstellt hast, starte mit dem Leitfaden Wissensdatenbanken erstellen. itellicoAI bietet zwei Zugriffsarten: Context Mode (Prompt Injection) und RAG Mode (RAG: Retrieval-Augmented Generation - ein Suchsystem, das nur die relevantesten Informationen findet, die dein Agent braucht).

Schnelle Entscheidung

Verwende Context, wenn…	Verwende RAG, wenn…
Inhalte klein sind (unter ein paar Tausend Wörter)	Inhalte groß sind (FAQs, Kataloge, vollständige Doku)
Der Agent sie bei jedem Anruf braucht	Der Agent sie nur für bestimmte Fragen braucht
Du keine Retrieval-Latenz möchtest	Du breite Abdeckung über viele Themen brauchst
Beispiele: Preistabelle, Öffnungszeiten, Rückgaberegelung	Beispiele: Produktkatalog, komplette FAQ-Bibliothek, Support-Doku

Unsicher? Starte mit RAG. Das ist für die meisten Anwendungsfälle sicherer. Wechsle zu Context nur für kleine Inhalte, die immer gebraucht werden.

Die zwei Zugriffsarten

Kontext-Modus

Prompt InjectionAlle Knowledge wird direkt zu Beginn jeder Interaktion in den Conversation-Context des Agenten injiziert (neben deinem Prompt).Am besten für: Kleine Wissensdatenbanken mit kritischen Informationen, die der Agent für jedes Gespräch braucht.

RAG Mode

RAG (Retrieval-Augmented Generation)Der Agent durchsucht und ruft relevante Knowledge dynamisch auf Basis des Gesprächsthemas ab.Am besten für: Größere Wissensdatenbanken, bei denen pro Gespräch nur bestimmte Abschnitte benötigt werden.

Context Mode (Prompt Injection)

Wie es funktioniert

Im Context Mode lädt die Plattform deine Wissensdatenbank-Inhalte zu Beginn jedes Gesprächs direkt in den System-Prompt des Agenten:

System Prompt:
You are a helpful customer service agent.

[Your agent instructions...]

==== KNOWLEDGE BASE: Customer Support FAQ ====

### Billing & Payments
- Question: How do I update my payment method?
  Answer: You can update your payment method by...

- Question: When will I be billed?
  Answer: Billing occurs on the same day each month...

### Return Policy
[Full return policy content]

### Shipping Information
[Full shipping information]

==== END KNOWLEDGE BASE ====

Now assist the customer with their question.

Der Agent sieht ALLE Knowledge-Inhalte von Anfang an und kann während des Gesprächs darauf verweisen.

Formatierte Ausgabe

Standardmäßig injiziert das System Knowledge mit strukturierter Formatierung:

========================================
# Wissensdatenbank Name
Knowledge base description

## Folder Name
Folder description

### Item Title
----------------------------------------
Item content here
----------------------------------------
========================================

Dieses Format hilft dem Agenten, Struktur und Organisation der Knowledge zu verstehen.

Wann Context Mode sinnvoll ist

Kleine, wichtige Knowledge

Wenn dein Inhalt kompakt ist und der Agent ihn bei jedem Anruf braucht, stellt Context Mode sicher, dass er immer verfügbar ist.Beispiel-Use-Case: Ein Support-Agent mit einer Wissensdatenbank, die enthält:

10 häufige FAQs
Rückgaberegelung
Kontaktinformationen
Versandoptionen

Kritische Informationen, die immer gebraucht werden

Informationen, auf die der Agent bei den meisten oder allen Anrufen verweisen muss.Beispiel-Use-Case: Ein Booking-Agent, der braucht:

Unternehmensrichtlinien (immer)
Verfügbare Services (immer)
Preisstruktur (immer)
Buchungsprozesse (immer)

Hochstrukturierte Informationen

Wenn Wissenseinträge aufeinander verweisen oder ein in sich geschlossenes Ganzes bilden.Beispiel-Use-Case: Produktkonfigurations-Agent mit:

Abhängigkeiten bei Optionen (“Wenn X gewählt wird, Y anbieten”)
Kompatibilitätsmatrix
Paket-Bundles
Preise, die von Kombinationen abhängen

Vorteile des Context Mode

Immer verfügbar

Sofortiger Zugriff auf alle Knowledge ohne Suchverzögerung

Besser für kleine Mengen

Kleine Knowledge-Sets effizient im Kontextfenster verarbeiten

Deterministisch

Liefert jedes Mal genau dieselbe Knowledge

Funktioniert mit Variablen

Jinja-Variablen einbinden, die zur Laufzeit aufgelöst werden

Einschränkungen des Context Mode

Context Mode ist insgesamt auf 10,000 Tokens (ungefähr 7,500 Wörter) begrenzt über alle zugewiesenen Knowledge-Quellen.

Trade-offs:

Alle Context-Mode-Inhalte werden mit jeder Anfrage gesendet, also bedeuten mehr Inhalte höheren Kosten- und Latenzaufwand
Die gesamte Wissensdatenbank wird einbezogen, auch wenn nur ein kleiner Teil für diesen Anruf relevant ist
Am besten für Inhalte mit wenigen Tausend Wörtern oder weniger - nutze RAG für größere Mengen

RAG Mode (Retrieval-Augmented Generation)

Wie es funktioniert

Im RAG Mode speichert die Plattform deine Wissensdatenbank in einer Vektordatenbank. Wenn der Agent Informationen braucht:

Nutzer fragt: “Wie lautet eure Rückgaberegelung?”
Agent erkennt den Bedarf: Der Agent stellt fest, dass er Wissen zu Rückgaben braucht
System sucht: Das RAG-System durchsucht die Wissensdatenbank nach relevanten Inhalten
Relevante Inhalte werden abgerufen: Nur der Abschnitt zur Rückgabe wird geholt
Agent antwortet: Der Agent nutzt das abgerufene Wissen für die Antwort

Der Agent sieht nur die Knowledge, die er braucht, und zwar dann, wenn er sie braucht.

Intelligentes Retrieval

RAG nutzt semantische Suche mit Vektor-Embeddings, um relevante Knowledge zu finden:

User: "I need to send back the shoes I bought last week"

RAG System thinks:
- Keywords: "send back", "shoes", "bought"
- Semantic meaning: Returns, possibly exchange
- Search knowledge for: return policy, shipping, exchanges

Retrieved knowledge:
- Return Policy Overview
- Return Shipping Instructions
- Exchange Procedures

NOT retrieved:
- Billing FAQ
- Product Specifications
- Account Management

Vorteile des RAG Mode

Skaliert über den Kontext hinaus

Unterstützt größere Wissensdatenbanken ohne die 10,000-Token-Context-Grenze

Schneller für große Knowledge

Reduziert die System-Prompt-Tokens für große Wissensdatenbanken

Effizient

Holt nur das, was für das aktuelle Thema gebraucht wird

Besser für Vielfalt

Behandelt viele unterschiedliche Themen gut

Wichtige Punkte beim RAG Mode

RAG hängt von der Suchgenauigkeit ab. Wenn deine Wissenseinträge nicht klar geschrieben sind, kann Retrieval relevante Informationen verpassen.

Die Retrieval-Qualität hängt ab von:

klaren, beschreibenden Titeln für Wissenseinträge
gut strukturiertem Inhalt
sinnvoller Kategorisierung in Ordnern
dem Vermeiden doppelter oder widersprüchlicher Informationen

Den richtigen Modus wählen

Nutze diesen Entscheidungsleitfaden, um die beste Zugriffsart zu wählen:

Hybrid-Ansatz

Du kannst beide Modi für verschiedene Wissensdatenbanken am selben Agenten nutzen: Beispielkonfiguration:

Context Mode: Kleine Wissensdatenbank “Core Policies” (immer benötigt)
RAG Mode: Große Wissensdatenbank “Product Catalog” (bei Bedarf abrufen)

Das kombiniert die Stärken beider Methoden.

Deine Konfiguration testen

Wissensdatenbank zuweisen

Konfiguriere deinen Agenten mit einer Wissensdatenbank im Context- oder RAG-Mode.

Test starten

Nutze das Test-Agent-Menü für einen Chat-, Web- oder Phone-Call.

Nach Knowledge-Inhalten fragen

Stelle Fragen, die aus deiner Wissensdatenbank beantwortet werden sollten.Beispielfragen:

“Wie lautet eure Rückgaberegelung?”
“Wie viel kostet der Pro-Plan?”
“Wie sind eure Öffnungszeiten?”

Antworten prüfen

Bestätige, dass der Agent Knowledge-Inhalte korrekt in den Antworten verwendet.

Edge Cases testen

Frage nach Themen, die nicht in deiner Wissensdatenbank enthalten sind, um sicherzustellen, dass der Agent angemessen reagiert (“Ich habe diese Information nicht”).

Best Practices

Bei großen Bases mit RAG starten

Wenn du unsicher bist, nutze RAG Mode. Das ist für große Wissensdatenbanken sicherer, und du kannst später immer noch zu Context Mode wechseln.

Klare, vollständige Inhalte schreiben

RAG verwendet semantische Suche, um relevante Knowledge zu finden. Schreibe vollständige, gut formulierte Inhalte, die natürlich die Begriffe und Konzepte enthalten, nach denen Nutzer fragen werden.Gut: “Our return policy allows returns within 30 days of purchase for physical products. Digital products cannot be returned once downloaded.”Schlecht: “See policy doc” oder unvollständige Satzfragmente

Beide Modi testen

Probiere Context und RAG Mode mit deiner Wissensdatenbank aus und schau, welcher für deinen Anwendungsfall besser funktioniert.

Strategisch kombinieren

Nutze Context Mode für kritische, häufig benötigte Infos und RAG Mode für umfangreiches Referenzmaterial.

Fehlerbehebung

Agent nutzt Knowledge nicht (Context Mode)

Prüfen:

Sind alle Wissenseinträge grün (ready to use)?
Reicht der verbleibende Kontext (nicht abgeschnitten)?

Lösung:

Fehlgeschlagene Items beheben
Knowledge verkleinern oder zu RAG wechseln

Agent findet Knowledge nicht (RAG Mode)

Prüfen:

Ist der Inhalt gut organisiert?
Fragst du nach Themen, die zur Knowledge passen?

Lösung:

Detailliertere Inhalte hinzufügen
Mit anderer Formulierung testen
Keywords in den Inhalt aufnehmen

Agent liefert falsche oder veraltete Informationen

Prüfen:

Sind die Knowledge-Inhalte korrekt und aktuell?
Gibt es widersprüchliche Informationen in mehreren Items?

Lösung:

Knowledge-Inhalte aktualisieren
Duplikate und Widersprüche entfernen

Context-Nutzung zu hoch

Lösungen:

Für große Wissensdatenbanken auf RAG Mode wechseln
Knowledge in kleinere, fokussierte Bases aufteilen
Prompt-Länge des Agenten reduzieren
Ausführliche oder redundante Inhalte entfernen

Nächste Schritte

Wissensdatenbanken erstellen

Wissensinhalte aufbauen und organisieren

Inhaltstypen

Mehr über Text-, Datei-, URL- und Website-Crawl-Items erfahren

Template-Syntax

Knowledge-Referenzen im Prompt verwenden

Agent testen

Testen, wie dein Agent Knowledge nutzt

​Zwei Zugriffsarten

​Schnelle Entscheidung

​Die zwei Zugriffsarten

Kontext-Modus

RAG Mode

​Context Mode (Prompt Injection)

​Wie es funktioniert

​Formatierte Ausgabe

​Wann Context Mode sinnvoll ist

​Vorteile des Context Mode

Immer verfügbar

Besser für kleine Mengen

Deterministisch

Funktioniert mit Variablen

​Einschränkungen des Context Mode

​RAG Mode (Retrieval-Augmented Generation)

​Wie es funktioniert

​Intelligentes Retrieval

​Vorteile des RAG Mode

Skaliert über den Kontext hinaus

Schneller für große Knowledge

Effizient

Besser für Vielfalt

​Wichtige Punkte beim RAG Mode

​Den richtigen Modus wählen

​Hybrid-Ansatz

​Deine Konfiguration testen

​Best Practices

​Fehlerbehebung

​Nächste Schritte

Wissensdatenbanken erstellen

Inhaltstypen

Template-Syntax

Agent testen

Zwei Zugriffsarten

Schnelle Entscheidung

Die zwei Zugriffsarten

Context Mode (Prompt Injection)

Wie es funktioniert

Formatierte Ausgabe

Wann Context Mode sinnvoll ist

Vorteile des Context Mode

Einschränkungen des Context Mode

RAG Mode (Retrieval-Augmented Generation)

Wie es funktioniert

Intelligentes Retrieval

Vorteile des RAG Mode

Wichtige Punkte beim RAG Mode

Den richtigen Modus wählen

Hybrid-Ansatz

Deine Konfiguration testen

Best Practices

Fehlerbehebung

Nächste Schritte