Zwei Zugriffsarten
Wenn du Knowledge an deinen Agenten zuweist, musst du entscheiden, wie der Agent auf diese Informationen zugreift. Wenn du noch keine Wissensdatenbank erstellt hast, starte mit dem Leitfaden Wissensdatenbanken erstellen. itellicoAI bietet zwei Zugriffsarten: Context Mode (Prompt Injection) und RAG Mode (RAG: Retrieval-Augmented Generation - ein Suchsystem, das nur die relevantesten Informationen findet, die dein Agent braucht).Schnelle Entscheidung
| Verwende Context, wenn… | Verwende RAG, wenn… |
|---|---|
| Inhalte klein sind (unter ein paar Tausend Wörter) | Inhalte groß sind (FAQs, Kataloge, vollständige Doku) |
| Der Agent sie bei jedem Anruf braucht | Der Agent sie nur für bestimmte Fragen braucht |
| Du keine Retrieval-Latenz möchtest | Du breite Abdeckung über viele Themen brauchst |
| Beispiele: Preistabelle, Öffnungszeiten, Rückgaberegelung | Beispiele: Produktkatalog, komplette FAQ-Bibliothek, Support-Doku |
Die zwei Zugriffsarten
Kontext-Modus
Prompt InjectionAlle Knowledge wird direkt zu Beginn jeder Interaktion in den Conversation-Context des Agenten injiziert (neben deinem Prompt).Am besten für: Kleine Wissensdatenbanken mit kritischen Informationen, die der Agent für jedes Gespräch braucht.
RAG Mode
RAG (Retrieval-Augmented Generation)Der Agent durchsucht und ruft relevante Knowledge dynamisch auf Basis des Gesprächsthemas ab.Am besten für: Größere Wissensdatenbanken, bei denen pro Gespräch nur bestimmte Abschnitte benötigt werden.
Context Mode (Prompt Injection)
Wie es funktioniert
Im Context Mode lädt die Plattform deine Wissensdatenbank-Inhalte zu Beginn jedes Gesprächs direkt in den System-Prompt des Agenten:Formatierte Ausgabe
Standardmäßig injiziert das System Knowledge mit strukturierter Formatierung:Wann Context Mode sinnvoll ist
Kleine, wichtige Knowledge
Kleine, wichtige Knowledge
Wenn dein Inhalt kompakt ist und der Agent ihn bei jedem Anruf braucht, stellt Context Mode sicher, dass er immer verfügbar ist.Beispiel-Use-Case:
Ein Support-Agent mit einer Wissensdatenbank, die enthält:
- 10 häufige FAQs
- Rückgaberegelung
- Kontaktinformationen
- Versandoptionen
Kritische Informationen, die immer gebraucht werden
Kritische Informationen, die immer gebraucht werden
Informationen, auf die der Agent bei den meisten oder allen Anrufen verweisen muss.Beispiel-Use-Case:
Ein Booking-Agent, der braucht:
- Unternehmensrichtlinien (immer)
- Verfügbare Services (immer)
- Preisstruktur (immer)
- Buchungsprozesse (immer)
Hochstrukturierte Informationen
Hochstrukturierte Informationen
Wenn Wissenseinträge aufeinander verweisen oder ein in sich geschlossenes Ganzes bilden.Beispiel-Use-Case:
Produktkonfigurations-Agent mit:
- Abhängigkeiten bei Optionen (“Wenn X gewählt wird, Y anbieten”)
- Kompatibilitätsmatrix
- Paket-Bundles
- Preise, die von Kombinationen abhängen
Vorteile des Context Mode
Immer verfügbar
Sofortiger Zugriff auf alle Knowledge ohne Suchverzögerung
Besser für kleine Mengen
Kleine Knowledge-Sets effizient im Kontextfenster verarbeiten
Deterministisch
Liefert jedes Mal genau dieselbe Knowledge
Funktioniert mit Variablen
Jinja-Variablen einbinden, die zur Laufzeit aufgelöst werden
Einschränkungen des Context Mode
Trade-offs:- Alle Context-Mode-Inhalte werden mit jeder Anfrage gesendet, also bedeuten mehr Inhalte höheren Kosten- und Latenzaufwand
- Die gesamte Wissensdatenbank wird einbezogen, auch wenn nur ein kleiner Teil für diesen Anruf relevant ist
- Am besten für Inhalte mit wenigen Tausend Wörtern oder weniger - nutze RAG für größere Mengen
RAG Mode (Retrieval-Augmented Generation)
Wie es funktioniert
Im RAG Mode speichert die Plattform deine Wissensdatenbank in einer Vektordatenbank. Wenn der Agent Informationen braucht:- Nutzer fragt: “Wie lautet eure Rückgaberegelung?”
- Agent erkennt den Bedarf: Der Agent stellt fest, dass er Wissen zu Rückgaben braucht
- System sucht: Das RAG-System durchsucht die Wissensdatenbank nach relevanten Inhalten
- Relevante Inhalte werden abgerufen: Nur der Abschnitt zur Rückgabe wird geholt
- Agent antwortet: Der Agent nutzt das abgerufene Wissen für die Antwort
Intelligentes Retrieval
RAG nutzt semantische Suche mit Vektor-Embeddings, um relevante Knowledge zu finden:Vorteile des RAG Mode
Skaliert über den Kontext hinaus
Unterstützt größere Wissensdatenbanken ohne die 10,000-Token-Context-Grenze
Schneller für große Knowledge
Reduziert die System-Prompt-Tokens für große Wissensdatenbanken
Effizient
Holt nur das, was für das aktuelle Thema gebraucht wird
Besser für Vielfalt
Behandelt viele unterschiedliche Themen gut
Wichtige Punkte beim RAG Mode
RAG hängt von der Suchgenauigkeit ab. Wenn deine Wissenseinträge nicht klar geschrieben sind, kann Retrieval relevante Informationen verpassen.
- klaren, beschreibenden Titeln für Wissenseinträge
- gut strukturiertem Inhalt
- sinnvoller Kategorisierung in Ordnern
- dem Vermeiden doppelter oder widersprüchlicher Informationen
Den richtigen Modus wählen
Nutze diesen Entscheidungsleitfaden, um die beste Zugriffsart zu wählen:Hybrid-Ansatz
Du kannst beide Modi für verschiedene Wissensdatenbanken am selben Agenten nutzen: Beispielkonfiguration:- Context Mode: Kleine Wissensdatenbank “Core Policies” (immer benötigt)
- RAG Mode: Große Wissensdatenbank “Product Catalog” (bei Bedarf abrufen)
Deine Konfiguration testen
Wissensdatenbank zuweisen
Konfiguriere deinen Agenten mit einer Wissensdatenbank im Context- oder RAG-Mode.
Nach Knowledge-Inhalten fragen
Stelle Fragen, die aus deiner Wissensdatenbank beantwortet werden sollten.Beispielfragen:
- “Wie lautet eure Rückgaberegelung?”
- “Wie viel kostet der Pro-Plan?”
- “Wie sind eure Öffnungszeiten?”
Best Practices
Bei großen Bases mit RAG starten
Bei großen Bases mit RAG starten
Wenn du unsicher bist, nutze RAG Mode. Das ist für große Wissensdatenbanken sicherer, und du kannst später immer noch zu Context Mode wechseln.
Klare, vollständige Inhalte schreiben
Klare, vollständige Inhalte schreiben
RAG verwendet semantische Suche, um relevante Knowledge zu finden. Schreibe vollständige, gut formulierte Inhalte, die natürlich die Begriffe und Konzepte enthalten, nach denen Nutzer fragen werden.Gut: “Our return policy allows returns within 30 days of purchase for physical products. Digital products cannot be returned once downloaded.”Schlecht: “See policy doc” oder unvollständige Satzfragmente
Beide Modi testen
Beide Modi testen
Probiere Context und RAG Mode mit deiner Wissensdatenbank aus und schau, welcher für deinen Anwendungsfall besser funktioniert.
Strategisch kombinieren
Strategisch kombinieren
Nutze Context Mode für kritische, häufig benötigte Infos und RAG Mode für umfangreiches Referenzmaterial.
Fehlerbehebung
Agent nutzt Knowledge nicht (Context Mode)
Agent nutzt Knowledge nicht (Context Mode)
Prüfen:
- Sind alle Wissenseinträge grün (ready to use)?
- Reicht der verbleibende Kontext (nicht abgeschnitten)?
- Fehlgeschlagene Items beheben
- Knowledge verkleinern oder zu RAG wechseln
Agent findet Knowledge nicht (RAG Mode)
Agent findet Knowledge nicht (RAG Mode)
Prüfen:
- Ist der Inhalt gut organisiert?
- Fragst du nach Themen, die zur Knowledge passen?
- Detailliertere Inhalte hinzufügen
- Mit anderer Formulierung testen
- Keywords in den Inhalt aufnehmen
Agent liefert falsche oder veraltete Informationen
Agent liefert falsche oder veraltete Informationen
Prüfen:
- Sind die Knowledge-Inhalte korrekt und aktuell?
- Gibt es widersprüchliche Informationen in mehreren Items?
- Knowledge-Inhalte aktualisieren
- Duplikate und Widersprüche entfernen
Context-Nutzung zu hoch
Context-Nutzung zu hoch
Lösungen:
- Für große Wissensdatenbanken auf RAG Mode wechseln
- Knowledge in kleinere, fokussierte Bases aufteilen
- Prompt-Länge des Agenten reduzieren
- Ausführliche oder redundante Inhalte entfernen
Nächste Schritte
Wissensdatenbanken erstellen
Wissensinhalte aufbauen und organisieren
Inhaltstypen
Mehr über Text-, Datei-, URL- und Website-Crawl-Items erfahren
Template-Syntax
Knowledge-Referenzen im Prompt verwenden
Agent testen
Testen, wie dein Agent Knowledge nutzt