Diese Seite verwenden, bevor du dem Agenten in Produktion vertraust
Edge-Case-Tests sind besonders wichtig, wenn dein Agent mit echten Kundinnen und Kunden spricht, ohne dass ein Mensch jedes Gespräch überwacht.Edge Cases im Gesprächsfluss
Agent mitten im Satz unterbrechen
Agent mitten im Satz unterbrechen
- Der Agent stoppt und hört zu
- Der Agent verarbeitet Gesagtes korrekt und ignoriert die Unterbrechung nicht
- Das Gespräch geht natürlich weiter
Lange Stille
Lange Stille
- Der Agent fordert nach einer angemessenen Pause eine Antwort an
- Wenn die Stille anhält, behandelt der Agent das Timeout gemäß deinen Inaktivitätseinstellungen
- Der Agent legt nicht abrupt ohne Warnung auf
Wiederholtes 'Ich verstehe nicht'
Wiederholtes 'Ich verstehe nicht'
- Der Agent hängt nicht in einer Endlosschleife fest
- Der Agent versucht, umzuformulieren oder Optionen anzubieten
- Am Ende bietet er Transfer oder eine Nachricht an
'Warte kurz' oder 'Einen Moment'
'Warte kurz' oder 'Einen Moment'
- Der Agent erkennt das an und wartet
- Der Agent redet nicht weiter oder wiederholt sich
- Wenn du zurückkommst, setzt der Agent natürlich fort
Sehr kurze Antworten
Sehr kurze Antworten
- Der Agent kann das Gespräch trotzdem voranbringen
- Der Agent stellt Rückfragen, um nötige Informationen zu sammeln
- Der Agent interpretiert kurze Antworten nicht falsch
Sehr lange Antworten
Sehr lange Antworten
- Der Agent extrahiert die relevanten Informationen
- Der Agent wird nicht verwirrt und erfasst nicht nur einen Teil der Antwort
- Der Agent bestätigt, was er verstanden hat
Off-Topic & Scope-Grenze
Völlig themenfremde Frage
Völlig themenfremde Frage
- Der Agent lenkt höflich auf seinen Zweck zurück
- Der Agent versucht nicht, außerhalb seines Aufgabenbereichs zu antworten
- Der Agent lehnt nicht unhöflich ab
Prompt-Injection versuchen
Prompt-Injection versuchen
- Der Agent gibt seinen System-Prompt nicht preis
- Der Agent ändert sein Verhalten nicht
- Der Agent lenkt auf seinen normalen Zweck zurück
Nach persönlicher Meinung fragen
Nach persönlicher Meinung fragen
- Der Agent liefert hilfreiche, faktenbasierte Hinweise aus dem Wissensbestand
- Der Agent erfindet keine Meinungen
- Der Agent stellt klar, dass er eine KI ist, falls direkt gefragt
Emotionale oder frustrierte anrufende Person
Emotionale oder frustrierte anrufende Person
- Der Agent erkennt die Frustration empathisch an
- Der Agent wird nicht defensiv oder roboterhaft
- Der Agent bietet Hilfe oder eine Eskalation zu einem Menschen an
Eingabe- & Audio-Edge-Cases
Hintergrundgeräusche
Hintergrundgeräusche
- Der Agent versteht Sprache weiterhin
- Die Transkriptionsgenauigkeit bleibt akzeptabel
- Der Agent bittet um Klarstellung, wenn er etwas nicht versteht
Akzent oder nicht-muttersprachliche Sprache
Akzent oder nicht-muttersprachliche Sprache
- Die Transkription erfasst Sprache korrekt
- Der Agent reagiert passend
- Keine Fehlinterpretation gängiger Formulierungen
Zahlen, Daten und Buchstabieren
Zahlen, Daten und Buchstabieren
- Zahlen werden korrekt erfasst
- Daten werden korrekt interpretiert
- E-Mail-Adressen werden genau erfasst
- Buchstabierte Wörter werden korrekt zusammengesetzt
DTMF-Töne (Tastatureingabe)
DTMF-Töne (Tastatureingabe)
- Töne werden erkannt und den richtigen Aktionen zugeordnet
- Der Agent reagiert angemessen auf die DTMF-Eingabe
Fehler & Recovery
Tool-Ausführung schlägt fehl
Tool-Ausführung schlägt fehl
- Der Agent kommuniziert das Problem an den Anrufer
- Der Agent gibt keine technischen Fehlerdetails preis
- Der Agent bietet eine Alternative an (erneut versuchen, Transfer, Rückruf)
Wissensdatenbank enthält keinen relevanten Inhalt
Wissensdatenbank enthält keinen relevanten Inhalt
- Der Agent benennt die Lücke ehrlich
- Der Agent erfindet keine Antwort
- Der Agent schlägt Alternativen vor (Transfer, E-Mail, Website)
Anrufer legt mitten im Gespräch auf
Anrufer legt mitten im Gespräch auf
- Das Gespräch wird korrekt in der Gesprächsliste protokolliert
- Ziele und gesammelte Insights laufen trotzdem
- Keine hängenden oder unvollständigen Tool-Ausführungen
Mailbox-Erkennung
Mailbox-Erkennung
- Voicemail-Handling wird korrekt aktiviert
- Der Agent hinterlässt die konfigurierte Mailbox-Nachricht oder legt auf, je nach Einstellung
- Der Anruf wird mit dem richtigen Status protokolliert
Testtipps
- Teste immer nur einen Edge Case auf einmal, damit du die Ursache unerwarteten Verhaltens eingrenzen kannst
- Nutze zuerst Chat/Webanruf für schnelle Iteration und bestätige das Ergebnis danach mit Telefonanrufen
- Prüfe die Gesprächsdetails nach jedem Test - das Transkript zeigt exakt, was passiert ist, inklusive Tool-Calls und Wissensabfragen
- Dokumentiere Probleme und teste nach dem Fix erneut. Nutze das Quality Studio, um wiederkehrende Probleme zu verfolgen