Zum Hauptinhalt springen

Überblick

Wenn du Wissen deinem Agent zuweist, musst du wählen, wie der Agent auf diese Informationen zugreift. itellicoAI bietet zwei Zugriffsmethoden: Context Mode (Prompt-Injektion) und RAG Mode (Retrieval-Augmented Generation). Das Verständnis des Unterschieds zwischen diesen Ansätzen hilft dir, die Leistung und Genauigkeit deines Agenten zu optimieren.

Die zwei Zugriffsmethoden

Context Mode

Prompt-InjektionAlles Wissen wird direkt zu Beginn jeder Interaktion in den Konversationskontext des Agenten eingefügt.Am besten für: Kleine Wissensdatenbanken mit kritischen Informationen, die der Agent für jedes Gespräch benötigt.

RAG Mode

Retrieval-Augmented GenerationAgent sucht und ruft dynamisch relevantes Wissen basierend auf dem Gesprächsthema ab.Am besten für: Große Wissensdatenbanken, bei denen nur bestimmte Abschnitte pro Gespräch benötigt werden.

Context Mode (Prompt-Injektion)

Wie es funktioniert

Im Context Mode wird der Inhalt deiner Wissensdatenbank zu Beginn jedes Gesprächs direkt in den System-Prompt des Agenten geladen:
System Prompt:
Sie sind ein hilfreicher Kundenservice-Agent.

[Ihre Agentenanweisungen...]

==== WISSENSDATENBANK: Kunden-Support-FAQ ====

### Abrechnung & Zahlungen
- Frage: Wie aktualisiere ich meine Zahlungsmethode?
  Antwort: Sie können Ihre Zahlungsmethode aktualisieren, indem...

- Frage: Wann werde ich abgerechnet?
  Antwort: Die Abrechnung erfolgt am selben Tag jeden Monat...

### Rückgaberichtlinie
[Vollständiger Rückgaberichtlinieninhalt]

### Versandinformationen
[Vollständige Versandinformationen]

==== ENDE WISSENSDATENBANK ====

Unterstützen Sie nun den Kunden bei seiner Frage.
Der Agent sieht ALLE Wissensinhalte von Anfang an und kann sie während des gesamten Gesprächs referenzieren.

Formatierte Ausgabe

Standardmäßig wird Wissen mit strukturierter Formatierung eingefügt:
========================================
# Wissensdatenbank-Name
Wissensdatenbank-Beschreibung

## Ordnername
Ordnerbeschreibung

### Elementtitel
----------------------------------------
Elementinhalt hier
----------------------------------------
========================================
Diese Formatierung hilft dem Agent, die Struktur und Organisation des Wissens zu verstehen.

Wann Context Mode verwendet werden sollte

Wenn deine Wissensdatenbank kompakt ist, stellt Context Mode sicher, dass der Agent immer den vollen Kontext hat.Beispiel-Anwendungsfall: Ein Support-Agent mit einer Wissensdatenbank, die enthält:
  • 10 häufige FAQs
  • Rückgaberichtlinie (500 Wörter)
  • Kontaktinformationen
  • Versandoptionen
Insgesamt: ~3.000 Wörter - passt problemlos in den Kontext.
Informationen, die der Agent bei den meisten oder allen Anrufen referenzieren muss.Beispiel-Anwendungsfall: Ein Buchungsagent, der benötigt:
  • Unternehmensrichtlinien (immer)
  • Verfügbare Dienste (immer)
  • Preisstruktur (immer)
  • Buchungsverfahren (immer)
Wenn Wissenselemente aufeinander verweisen oder ein zusammenhängendes Ganzes bilden.Beispiel-Anwendungsfall: Produktkonfigurations-Agent mit:
  • Optionsabhängigkeiten (“Wenn sie X wählen, biete Y an”)
  • Kompatibilitätsmatrix
  • Paketbündel
  • Preise, die von Kombinationen abhängen

Vorteile des Context Mode

Immer verfügbar

Agent hat sofortigen Zugriff auf alles Wissen ohne Suchverzögerung

Besser für kleine Mengen

Effizient, wenn Wissen bequem ins Kontextfenster passt

Deterministisch

Agent sieht jedes Mal genau dasselbe Wissen

Funktioniert mit Variablen

Wissen kann Jinja-Variablen enthalten, die im Kontext aufgelöst werden

Einschränkungen des Context Mode

Context Mode ist auf insgesamt 10.000 Token über alles zugewiesene Wissen begrenzt.
Einschränkungen:
  • Halte Wissensdatenbanken klein (< 1.000 Wörter)
  • Alles Wissen wird mit jeder Anfrage gesendet (höhere Kosten)
  • Alles Wissen wird jedes Mal verarbeitet (höhere Latenz)
  • Die gesamte Wissensdatenbank ist eingeschlossen, auch wenn nur ein kleiner Teil relevant ist

RAG Mode (Retrieval-Augmented Generation)

Wie es funktioniert

Im RAG Mode wird deine Wissensdatenbank in einer Vektordatenbank gespeichert. Wenn der Agent Informationen benötigt:
  1. Benutzer stellt eine Frage: “Was ist deine Rückgaberichtlinie?”
  2. Agent identifiziert Bedarf: Agent bestimmt, dass er Wissen über Rücksendungen benötigt
  3. System sucht: RAG-System durchsucht Wissensdatenbank nach relevantem Inhalt
  4. Relevanter Inhalt abgerufen: Nur der Rückgaberichtlinienabschnitt wird abgerufen
  5. Agent antwortet: Agent verwendet abgerufenes Wissen, um zu antworten
Der Agent sieht nur das Wissen, das er benötigt, wenn er es benötigt.

Intelligenter Abruf

RAG verwendet semantische Suche mit Vektoreinbettungen, um relevantes Wissen zu finden:
Benutzer: "Ich muss die Schuhe zurückschicken, die ich letzte Woche gekauft habe"

RAG-System denkt:
- Schlüsselwörter: "zurückschicken", "Schuhe", "gekauft"
- Semantische Bedeutung: Rücksendungen, möglicherweise Umtausch
- Suche Wissen nach: Rückgaberichtlinie, Versand, Umtausch

Abgerufenes Wissen:
- Rückgaberichtlinien-Übersicht
- Rücksendeversandanleitung
- Umtauschverfahren

NICHT abgerufen:
- Abrechnungs-FAQ
- Produktspezifikationen
- Kontoverwaltung

Vorteile des RAG Mode

Skaliert unendlich

Unterstützt massive Wissensdatenbanken ohne Kontextlimits

Schneller für großes Wissen

Reduziert System-Prompt-Token für große Wissensdatenbanken

Effizient

Ruft nur ab, was für das aktuelle Thema benötigt wird

Besser für Vielfalt

Handhabt große Vielfalt unzusammenhängender Themen gut

Überlegungen zum RAG Mode

RAG basiert auf der Qualität der Vektoreinbettung. Wenn deine Wissenselemente nicht klar geschrieben sind, kann der Abruf relevante Informationen übersehen.
Abrufqualität hängt ab von:
  • Klaren, beschreibenden Wissenselement-Titeln
  • Gut strukturiertem Inhalt
  • Ordnungsgemäßer Kategorisierung in Ordnern
  • Vermeidung von doppelten oder widersprüchlichen Informationen

Indikator für verbleibende Kontext-Token

Wenn du Context Mode verwendest, überwache deine verbleibenden Kontext-Token, um sicherzustellen, dass du genug Platz für Gespräche hast.

Den Indikator verstehen

Das Dashboard zeigt deine Kontextnutzung in den Wissenseinstellungen:
Wissenseinstellungen zeigen Kontextnutzung
Wissenseinstellungen zeigen Kontextnutzung
Du kannst sehen:
  • RAG-Modus: Dynamische Vektorsuche mit unbegrenzter Wissensgröße
  • Kontext-Modus: Zum System-Prompt hinzugefügt mit 10.000 Token-Limit

Den richtigen Modus wählen

Verwende diesen Entscheidungsleitfaden, um die beste Zugriffsmethode auszuwählen:

Hybrid-Ansatz

Du kannst beide Modi für verschiedene Wissensdatenbanken beim selben Agent verwenden: Beispielkonfiguration:
  • Context Mode: Kleine “Kernrichtlinien”-Wissensdatenbank (immer benötigt)
  • RAG Mode: Große “Produktkatalog”-Wissensdatenbank (bei Bedarf abrufen)
Dies gibt dir das Beste aus beiden Welten.

Deine Konfiguration testen

1

Wissensdatenbank zuweisen

Konfiguriere deinen Agent mit einer Wissensdatenbank im Context- oder RAG-Modus.
2

Testanruf starten

Verwende die Testanruf-Funktion im Dashboard.
3

Nach Wissensinhalten fragen

Stelle Fragen, die aus deiner Wissensdatenbank beantwortet werden sollten.Beispielfragen:
  • “Was ist deine Rückgaberichtlinie?”
  • “Wie viel kostet der Pro-Plan?”
  • “Was sind deine Geschäftszeiten?”
4

Antworten überprüfen

Bestätige, dass der Agent Wissensinhalte korrekt in Antworten verwendet.
5

Grenzfälle testen

Frage nach Themen NICHT in deiner Wissensdatenbank, um sicherzustellen, dass der Agent angemessen antwortet (“Ich habe diese Information nicht”).

Best Practices

Im Zweifelsfall verwende RAG Mode. Er ist sicherer für große Wissensdatenbanken und du kannst bei Bedarf immer zu Context Mode wechseln.
RAG verwendet semantische Suche, um relevantes Wissen zu finden. Schreibe vollständige, gut geschriebene Inhalte, die natürlich die Begriffe und Konzepte enthalten, nach denen Benutzer fragen werden.Gut: “Unsere Rückgaberichtlinie erlaubt Rücksendungen innerhalb von 30 Tagen nach dem Kauf für physische Produkte. Digitale Produkte können nicht zurückgegeben werden, sobald sie heruntergeladen wurden.”Schlecht: “Siehe Richtliniendokument” oder unvollständige Satzfragmente
Probiere sowohl Context- als auch RAG-Modus mit deiner Wissensdatenbank aus und sieh, welcher für deinen Anwendungsfall besser funktioniert.
Verwende Context Mode für kritische, häufig benötigte Informationen und RAG Mode für umfangreiches Referenzmaterial.

Fehlerbehebung

Prüfe:
  • Sind alle Wissenselemente im ABGESCHLOSSEN-Status?
  • Ist der verbleibende Kontext ausreichend (nicht abgeschnitten)?
Lösung:
  • Fehlgeschlagene Elemente beheben
  • Wissensgröße reduzieren oder zu RAG wechseln
Prüfe:
  • Ist der Inhalt gut organisiert?
  • Stellst du Fragen, die zum Wissen passen?
Lösung:
  • Detaillierteren Inhalt hinzufügen
  • Mit verschiedenen Formulierungen testen
  • Erwäge, Schlüsselwörter zum Inhalt hinzuzufügen
Prüfe:
  • Ist der Wissensinhalt korrekt und aktuell?
  • Hast du widersprüchliche Informationen in mehreren Elementen?
Lösung:
  • Wissensinhalt aktualisieren
  • Duplikate und Widersprüche entfernen
Lösungen:
  • Zu RAG Mode für große Wissensdatenbanken wechseln
  • Wissen in kleinere, fokussierte Datenbanken aufteilen
  • Länge der Agentenanweisungen reduzieren
  • Ausführlichen oder redundanten Inhalt entfernen

Nächste Schritte