Überblick
Wenn du Wissen deinem Agent zuweist, musst du wählen, wie der Agent auf diese Informationen zugreift. itellicoAI bietet zwei Zugriffsmethoden: Context Mode (Prompt-Injektion) und RAG Mode (Retrieval-Augmented Generation). Das Verständnis des Unterschieds zwischen diesen Ansätzen hilft dir, die Leistung und Genauigkeit deines Agenten zu optimieren.Die zwei Zugriffsmethoden
Context Mode
Prompt-InjektionAlles Wissen wird direkt zu Beginn jeder Interaktion in den Konversationskontext des Agenten eingefügt.Am besten für: Kleine Wissensdatenbanken mit kritischen Informationen, die der Agent für jedes Gespräch benötigt.
RAG Mode
Retrieval-Augmented GenerationAgent sucht und ruft dynamisch relevantes Wissen basierend auf dem Gesprächsthema ab.Am besten für: Große Wissensdatenbanken, bei denen nur bestimmte Abschnitte pro Gespräch benötigt werden.
Context Mode (Prompt-Injektion)
Wie es funktioniert
Im Context Mode wird der Inhalt deiner Wissensdatenbank zu Beginn jedes Gesprächs direkt in den System-Prompt des Agenten geladen:Formatierte Ausgabe
Standardmäßig wird Wissen mit strukturierter Formatierung eingefügt:Wann Context Mode verwendet werden sollte
Kleine Wissensdatenbanken (< 1.000 Wörter)
Kleine Wissensdatenbanken (< 1.000 Wörter)
Wenn deine Wissensdatenbank kompakt ist, stellt Context Mode sicher, dass der Agent immer den vollen Kontext hat.Beispiel-Anwendungsfall:
Ein Support-Agent mit einer Wissensdatenbank, die enthält:
- 10 häufige FAQs
- Rückgaberichtlinie (500 Wörter)
- Kontaktinformationen
- Versandoptionen
Kritische Informationen, die jedes Mal benötigt werden
Kritische Informationen, die jedes Mal benötigt werden
Informationen, die der Agent bei den meisten oder allen Anrufen referenzieren muss.Beispiel-Anwendungsfall:
Ein Buchungsagent, der benötigt:
- Unternehmensrichtlinien (immer)
- Verfügbare Dienste (immer)
- Preisstruktur (immer)
- Buchungsverfahren (immer)
Hochstrukturierte Informationen
Hochstrukturierte Informationen
Wenn Wissenselemente aufeinander verweisen oder ein zusammenhängendes Ganzes bilden.Beispiel-Anwendungsfall:
Produktkonfigurations-Agent mit:
- Optionsabhängigkeiten (“Wenn sie X wählen, biete Y an”)
- Kompatibilitätsmatrix
- Paketbündel
- Preise, die von Kombinationen abhängen
Vorteile des Context Mode
Immer verfügbar
Agent hat sofortigen Zugriff auf alles Wissen ohne Suchverzögerung
Besser für kleine Mengen
Effizient, wenn Wissen bequem ins Kontextfenster passt
Deterministisch
Agent sieht jedes Mal genau dasselbe Wissen
Funktioniert mit Variablen
Wissen kann Jinja-Variablen enthalten, die im Kontext aufgelöst werden
Einschränkungen des Context Mode
Einschränkungen:- Halte Wissensdatenbanken klein (< 1.000 Wörter)
- Alles Wissen wird mit jeder Anfrage gesendet (höhere Kosten)
- Alles Wissen wird jedes Mal verarbeitet (höhere Latenz)
- Die gesamte Wissensdatenbank ist eingeschlossen, auch wenn nur ein kleiner Teil relevant ist
RAG Mode (Retrieval-Augmented Generation)
Wie es funktioniert
Im RAG Mode wird deine Wissensdatenbank in einer Vektordatenbank gespeichert. Wenn der Agent Informationen benötigt:- Benutzer stellt eine Frage: “Was ist deine Rückgaberichtlinie?”
- Agent identifiziert Bedarf: Agent bestimmt, dass er Wissen über Rücksendungen benötigt
- System sucht: RAG-System durchsucht Wissensdatenbank nach relevantem Inhalt
- Relevanter Inhalt abgerufen: Nur der Rückgaberichtlinienabschnitt wird abgerufen
- Agent antwortet: Agent verwendet abgerufenes Wissen, um zu antworten
Intelligenter Abruf
RAG verwendet semantische Suche mit Vektoreinbettungen, um relevantes Wissen zu finden:Vorteile des RAG Mode
Skaliert unendlich
Unterstützt massive Wissensdatenbanken ohne Kontextlimits
Schneller für großes Wissen
Reduziert System-Prompt-Token für große Wissensdatenbanken
Effizient
Ruft nur ab, was für das aktuelle Thema benötigt wird
Besser für Vielfalt
Handhabt große Vielfalt unzusammenhängender Themen gut
Überlegungen zum RAG Mode
RAG basiert auf der Qualität der Vektoreinbettung. Wenn deine Wissenselemente nicht klar geschrieben sind, kann der Abruf relevante Informationen übersehen.
- Klaren, beschreibenden Wissenselement-Titeln
- Gut strukturiertem Inhalt
- Ordnungsgemäßer Kategorisierung in Ordnern
- Vermeidung von doppelten oder widersprüchlichen Informationen
Indikator für verbleibende Kontext-Token
Wenn du Context Mode verwendest, überwache deine verbleibenden Kontext-Token, um sicherzustellen, dass du genug Platz für Gespräche hast.Den Indikator verstehen
Das Dashboard zeigt deine Kontextnutzung in den Wissenseinstellungen:

- RAG-Modus: Dynamische Vektorsuche mit unbegrenzter Wissensgröße
- Kontext-Modus: Zum System-Prompt hinzugefügt mit 10.000 Token-Limit
Den richtigen Modus wählen
Verwende diesen Entscheidungsleitfaden, um die beste Zugriffsmethode auszuwählen:Hybrid-Ansatz
Du kannst beide Modi für verschiedene Wissensdatenbanken beim selben Agent verwenden: Beispielkonfiguration:- Context Mode: Kleine “Kernrichtlinien”-Wissensdatenbank (immer benötigt)
- RAG Mode: Große “Produktkatalog”-Wissensdatenbank (bei Bedarf abrufen)
Deine Konfiguration testen
Wissensdatenbank zuweisen
Konfiguriere deinen Agent mit einer Wissensdatenbank im Context- oder RAG-Modus.
Nach Wissensinhalten fragen
Stelle Fragen, die aus deiner Wissensdatenbank beantwortet werden sollten.Beispielfragen:
- “Was ist deine Rückgaberichtlinie?”
- “Wie viel kostet der Pro-Plan?”
- “Was sind deine Geschäftszeiten?”
Best Practices
Beginne mit RAG für große Datenbanken
Beginne mit RAG für große Datenbanken
Im Zweifelsfall verwende RAG Mode. Er ist sicherer für große Wissensdatenbanken und du kannst bei Bedarf immer zu Context Mode wechseln.
Schreibe klare, vollständige Inhalte
Schreibe klare, vollständige Inhalte
RAG verwendet semantische Suche, um relevantes Wissen zu finden. Schreibe vollständige, gut geschriebene Inhalte, die natürlich die Begriffe und Konzepte enthalten, nach denen Benutzer fragen werden.Gut: “Unsere Rückgaberichtlinie erlaubt Rücksendungen innerhalb von 30 Tagen nach dem Kauf für physische Produkte. Digitale Produkte können nicht zurückgegeben werden, sobald sie heruntergeladen wurden.”Schlecht: “Siehe Richtliniendokument” oder unvollständige Satzfragmente
Teste beide Modi
Teste beide Modi
Probiere sowohl Context- als auch RAG-Modus mit deiner Wissensdatenbank aus und sieh, welcher für deinen Anwendungsfall besser funktioniert.
Strategisch kombinieren
Strategisch kombinieren
Verwende Context Mode für kritische, häufig benötigte Informationen und RAG Mode für umfangreiches Referenzmaterial.
Fehlerbehebung
Agent verwendet Wissen nicht (Context Mode)
Agent verwendet Wissen nicht (Context Mode)
Prüfe:
- Sind alle Wissenselemente im ABGESCHLOSSEN-Status?
- Ist der verbleibende Kontext ausreichend (nicht abgeschnitten)?
- Fehlgeschlagene Elemente beheben
- Wissensgröße reduzieren oder zu RAG wechseln
Agent findet Wissen nicht (RAG Mode)
Agent findet Wissen nicht (RAG Mode)
Prüfe:
- Ist der Inhalt gut organisiert?
- Stellst du Fragen, die zum Wissen passen?
- Detaillierteren Inhalt hinzufügen
- Mit verschiedenen Formulierungen testen
- Erwäge, Schlüsselwörter zum Inhalt hinzuzufügen
Agent liefert falsche oder veraltete Informationen
Agent liefert falsche oder veraltete Informationen
Prüfe:
- Ist der Wissensinhalt korrekt und aktuell?
- Hast du widersprüchliche Informationen in mehreren Elementen?
- Wissensinhalt aktualisieren
- Duplikate und Widersprüche entfernen
Kontextnutzung zu hoch
Kontextnutzung zu hoch
Lösungen:
- Zu RAG Mode für große Wissensdatenbanken wechseln
- Wissen in kleinere, fokussierte Datenbanken aufteilen
- Länge der Agentenanweisungen reduzieren
- Ausführlichen oder redundanten Inhalt entfernen