Diagnoseverfahren
Wenn Probleme in der Produktion auftreten, verwende diesen systematischen Fehlerbehebungsprozess:- Symptome identifizieren - Was ist kaputt? Anrufe schlagen fehl, Agent verhält sich falsch, Integrationen sind ausgefallen?
- Umfang prüfen - Betrifft alle Anrufe oder nur eine bestimmte Teilmenge? Seit wann?
- Protokolle überprüfen - Suche nach Fehlermeldungen, Mustern, Stack Traces
- Ursache isolieren - Ist es ein Konfigurations-, Integrations-, Plattform- oder Carrier-Problem?
- Lösung anwenden - Stelle die kleinste Änderung bereit, die das Problem löst
- Validieren - Teste gründlich, bevor du es als gelöst markierst
Häufige Probleme & Lösungen
Keine Anrufe werden empfangen
Symptom: Telefonnummer klingelt nicht, Anrufe gehen ins Leere oder “Nummer nicht vergeben”Telefonnummerzuweisung überprüfen
Telefonnummerzuweisung überprüfen
Diagnose:
- Gehe zu Telefonie → Telefonnummern
- Finde deine Nummer, überprüfe die Spalte “Zugewiesener Agent”
- Überprüfe, ob sie dem richtigen Agenten zugewiesen ist (nicht “Nicht zugewiesen”)
- Klicke auf die Nummer → Wähle den Agenten aus dem Dropdown → Speichern
- Warte 30 Sekunden, bis die Routing-Aktualisierung propagiert ist
- Teste durch erneutes Anrufen der Nummer
SIP-Trunk-Registrierung überprüfen
SIP-Trunk-Registrierung überprüfen
Diagnose:Suche nach
"status": "registered". Wenn "unregistered" oder "failed":Häufige Ursachen:- Falsche SIP-Anmeldedaten (Benutzername/Passwort)
- IP nicht auf der Allowlist des Carriers
- Firewall blockiert UDP 5060
- Carrier-Endpunkt ist ausgefallen
- Überprüfe Anmeldedaten beim Carrier
- Überprüfe das Carrier-Portal für IP-Allowlist-Einstellungen
- Teste mit
curl -v sip:carrier.com:5060, um die Konnektivität zu überprüfen - Kontaktiere den Carrier, wenn ihr Endpunkt nicht erreichbar ist
Nummernbereitstellung überprüfen
Nummernbereitstellung überprüfen
Diagnose:
- Nummernstatus zeigt “Ausstehend” oder “Fehlgeschlagen”
- Nummer wurde gerade vor weniger als 5 Minuten gekauft
- Warte bis zu 10 Minuten, bis die Bereitstellung abgeschlossen ist
- Wenn länger als 30 Min. hängt, klicke auf “Bereitstellung wiederholen”
- Wenn weiterhin fehlschlägt, kontaktiere den Support mit Nummerndetails
Carrier-Routing-Probleme
Carrier-Routing-Probleme
Diagnose:
- Anrufe funktionieren, wenn SIE anrufen, aber nicht von Kundentelefonen
- Bestimmte Vorwahlen oder Carrier können dich nicht erreichen
- Überprüfe, ob die Routing-Tabelle des Carriers deinen Nummernbereich enthält
- Überprüfe CNAM (Caller Name) Registrierung
- Prüfe auf Spam-Kennzeichnung (verwende kostenlose Carrier-Lookup-Tools)
- Möglicherweise musst du den Carrier kontaktieren, um das Routing zu korrigieren
Schlechte Anrufqualität
Symptom: Abgehackte Audio, Echo, roboterhafte Stimme, lange VerzögerungenAudioprobleme (Echo, Rauschen, Aussetzer)
Audioprobleme (Echo, Rauschen, Aussetzer)
Diagnose:
Konfiguration:
- Öffne Gespräche → Wähle betroffenen Anruf
- Überprüfe “Anrufqualität”-Metriken:
- Jitter: Sollte <30ms sein
- Paketverlust: Sollte <1% sein
- RTT (Round Trip Time): Sollte <200ms sein
| Symptom | Wahrscheinliche Ursache | Lösung |
|---|---|---|
| Echo | Akustisches Echo (Lautsprecher-Feedback) | AEC in Agenteneinstellungen aktivieren |
| Abgehackt/Roboterhaft | Paketverlust oder Jitter | Netzwerkbandbreite prüfen, Codec wechseln |
| Aussetzer | Firewall blockiert RTP | UDP-Ports 10000-60000 öffnen |
| Einseitiges Audio | NAT-Traversal-Problem | TURN-Relay aktivieren |
| Hintergrundgeräusche | Geräuschvolle Umgebung | Rauschunterdrückung aktivieren |
Hohe Latenz (Agent antwortet langsam)
Hohe Latenz (Agent antwortet langsam)
Diagnose:
- Überprüfe Dashboard → Metriken → Durchschnittliche Antwortzeit
- Zielwert: <500ms
- Wenn >1000ms, untersuchen:
-
Verlangsamung des Modellanbieters
- Überprüfe status.openai.com oder status.anthropic.com
- Suche nach erhöhten Latenzen oder Ausfällen
- Wechsle zu Fallback-Modell, falls verfügbar
-
Großes Kontextfenster
- Lange Anweisungen oder riesige Wissensdatenbank-Abrufe
- Lösung: Anweisungslänge reduzieren, KB-Chunks auf 3 begrenzen
-
Langsame externe API
- Überprüfe Analytik → Aktionen für langsame API-Aufrufe
- APIs, die >2s benötigen, verzögern die Agentenantwort
- Timeout-Limits und Fallback-Antworten hinzufügen
-
Netzwerkprobleme
- Von mehreren Standorten aus überprüfen
- Wenn bestimmte Region betroffen ist, könnte es ein ISP-Routing-Problem sein
- Kontaktiere den Support zur Untersuchung
- Wechsle zu schnellerem Modell (GPT-4 → GPT-3.5 Turbo)
- Reduziere die Anzahl der abgerufenen Wissensdatenbank-Chunks
- Erhöhe API-Timeouts, um Wartezeiten zu vermeiden
Transkriptionsfehler (falsche Wörter)
Transkriptionsfehler (falsche Wörter)
Diagnose:Anderen Transkribierer ausprobieren:
- Überprüfe Transkript in Gespräche
- Suche nach Mustern:
- Fachbegriffe falsch verstanden → Füge zu benutzerdefiniertem Vokabular hinzu
- Akzente missverstanden → Probiere anderen Transkribierer aus
- Hintergrundgeräusche → Aktiviere Rauschunterdrückung
- Deepgram: Am besten für Akzente, geräuschvolle Umgebungen
- Azure: Am besten für Fachbegriffe
- Whisper: Am besten für mehrsprachig
- Höheren Bitrate-Codec verwenden (Opus 64kbps)
- Rauschunterdrückung aktivieren
- Mit anderem Telefon/Mikrofon für Web-Anrufe testen
Agent antwortet nicht korrekt
Symptom: Agent gibt falsche Antworten, ignoriert Anweisungen, verhält sich unberechenbarAgent folgt Anweisungen nicht
Agent folgt Anweisungen nicht
Diagnose:2. Anweisungen zu lang (>500 Wörter):
- Öffne Agenteneinstellungen → Konversation → Anweisungen
- Teste im Simulator mit genauem Szenario
- Prüfe, ob das Problem:
- Immer auftritt → Anweisungsproblem
- Intermittierend → Kontext- oder Modellproblem
- Modell verliert Fokus bei langen Prompts
- Lösung: In klare Abschnitte unterteilen, Aufzählungszeichen verwenden
- Beispiel: “Sei prägnant” aber auch “Gib detaillierte Erklärungen”
- Lösung: Ein Verhalten priorisieren, Konflikt entfernen
- Führe 10 Testanrufe mit Grenzfällen durch
- Überprüfe Transkripte auf Compliance
- Iteriere Anweisungen basierend auf Fehlern
Agent halluziniert oder erfindet Fakten
Agent halluziniert oder erfindet Fakten
Diagnose:2. Wissensdatenbank erweitern:4. Zitiermodus verwenden (falls verfügbar):
- Agent sagt Dinge, die nicht in der Wissensdatenbank oder den Anweisungen stehen
- Liefert falsche Produktdetails, Preise oder Richtlinien
- Wissensdatenbank nicht umfassend genug
- Anweisungen betonen nicht “nur bereitgestellte Informationen verwenden”
- Modell zu kreativ (Temperatur zu hoch)
- Überprüfe “Ich weiß nicht”-Antworten in Protokollen
- Füge fehlende Inhalte zu KB hinzu
- Teste Abruf mit Beispielabfragen
- Zwingt Agent, KB-Quellen zu zitieren
- Macht offensichtlich, wenn Info nicht in KB
Agent bleibt in Schleifen hängen
Agent bleibt in Schleifen hängen
Diagnose:2. Absichtserkennung verbessern:
- Agent wiederholt dieselbe Frage 3+ Mal
- Konversation dreht sich im Kreis
- Anrufer wird frustriert
- Agent erkennt nicht, dass Anrufer geantwortet hat
- Transkription fehlgeschlagen (Antwort nicht gehört)
- Anweisungen behandeln Grenzfall nicht
- Füge Beispiele für Grenzfallantworten zu Anweisungen hinzu
- Verwende strukturierte Antworten (DTMF für kritische Infos)
- Aktiviere “Ich bin mir nicht sicher”-Fallback zu Mensch
- Schweigender Anrufer
- Weitschweifiger Anrufer
- Anrufer mit starkem Akzent
- Geräuschvolle Umgebung
Integrationsfehler
Symptom: Aktionen werden nicht ausgelöst, API-Aufrufe schlagen fehl, Weiterleitungen funktionieren nichtAPI-Aktion schlägt fehl
API-Aktion schlägt fehl
Diagnose:
Testen:Wenn manueller Curl funktioniert, aber Agent fehlschlägt, überprüfe:
- Öffne Gespräche → Wähle fehlgeschlagenen Anruf
- Navigiere zum Tab Aktionen
- Suche nach Fehlermeldung (z. B. “API-Timeout”, “401 Unauthorized”)
| Fehler | Ursache | Lösung |
|---|---|---|
401 Unauthorized | Falscher API-Schlüssel | Schlüssel neu generieren, Agentenkonfiguration aktualisieren |
403 Forbidden | Berechtigungsproblem | Agent Zugriff auf Ressource gewähren |
404 Not Found | Falsche Endpunkt-URL | URL in Aktionskonfiguration überprüfen |
408 Timeout | API zu langsam | Timeout erhöhen (Standard 5s → 10s) |
500 Internal Server Error | Externe API ausgefallen | API-Statusseite prüfen, Wiederholungslogik hinzufügen |
SSL Certificate Error | HTTPS-Problem | Zertifikat gültig, nicht abgelaufen überprüfen |
- IP-Allowlisting (Agenten-IPs müssen möglicherweise auf Allowlist gesetzt werden)
- Rate-Limiting (Agent kann Limits schneller erreichen als manuelles Testen)
Weiterleitung schlägt fehl
Weiterleitung schlägt fehl
Diagnose:
- Agent sagt “Weiterleitung…” aber Anruf bricht ab oder nichts passiert
- Überprüfe Protokolle → Aktionen für Weiterleitungsstatus
- Überprüfe Nummernformat (muss E.164 sein: +1234567890)
- Überprüfe, ob Nummer erreichbar ist (rufe manuell an)
- Einige Carrier unterstützen SIP REFER für Weiterleitungen nicht
- Lösung: Verwende “Betreute Weiterleitung” statt “Blindweiterleitung”
- Oder aktiviere “Anruf-Bridging”-Modus
- Prüfe bei Carrier, ob Weiterleitungen aktiviert sind
- Möglicherweise musst du SIP-Trunk upgraden, um zu unterstützen
Wissensdatenbank ruft nicht ab
Wissensdatenbank ruft nicht ab
Diagnose:Häufige Ursachen:1. KB nicht mit Agent verknüpft:
- Agent sagt “Ich weiß nicht”, wenn Antwort in KB ist
- Teste Abruf manuell:
- Überprüfe Agenteneinstellungen → Wissen → KB zugewiesen überprüfen
- Kürzlich hochgeladener Inhalt benötigt 2-5 Minuten zum Indizieren
- Überprüfe, dass KB-Status “Indiziert” zeigt, nicht “Verarbeitung läuft”
- Kunde fragt “Kann ich Geld zurückbekommen?” aber KB sagt “Rückerstattungsrichtlinie”
- Lösung: Synonyme hinzufügen, KB-Inhalt umschreiben, um gängige Formulierungen zu entsprechen
- Minimale Ähnlichkeitsschwelle zu hoch (z. B. 0,9)
- Lösung: Auf 0,7-0,8 senken
Kapazität & Leistung
Gleichzeitigkeitslimits erreichen
Gleichzeitigkeitslimits erreichen
Symptom: Besetztzeichen, Anrufe minutenlang in Warteschlange, “Alle Agenten beschäftigt”-MeldungDiagnose:
- Überprüfe Dashboard → Kapazität für aktuelle/max Gleichzeitigkeit
- Anrufvolumen-Diagramm für Spitzenzeiten überprüfen
- Warteschlange aktivieren: Lass Anrufer warten statt Besetztzeichen
- Überlauf-Agent hinzufügen: Leite bei Kapazität an Backup-Agent weiter
- Geschäftszeiten erweitern: Verteile Volumen über mehr Stunden
- Rückruf anbieten: “Wir rufen dich in 10 Minuten zurück”
- Plan upgraden: Erhöhe Limit für gleichzeitige Anrufe
- Lastverteilung: Erstelle mehrere Agenten, verteile Nummern
- Auto-Skalierung: Aktiviere dynamische Kapazitätsskalierung (Enterprise)
- Außerhalb der Spitzenzeiten Anreize: Fördere Anrufe während verkehrsschwacher Zeiten
Hohes Anrufvolumen überlastet System
Hohes Anrufvolumen überlastet System
Symptom: Anrufe brauchen länger zum Verbinden, Warteschlange baut sich auf, Fehler steigen sprunghaftDiagnose:
- Plötzlicher Verkehrsspike (3x+ normales Volumen)
- Überprüfe auf:
- Marketingkampagne gestartet?
- Medienerwähnung / viraler Beitrag?
- Systemausfall verursacht Wiederholungssturm?
- Rate-Limit: Reduziere vorübergehend max. gleichzeitige Anrufe, um zu stabilisieren
- Aggressiv in Warteschlange: Halte Anrufe statt fallen lassen
- Fallback-Nachricht: “Ungewöhnlich hohes Volumen. Bitte versuche es in 15 Minuten erneut.”
- Notfall-Skalierung: Kontaktiere Support für vorübergehende Kapazitätserhöhung
- Sage Verkehr für bekannte Ereignisse vorher (Produkteinführungen, Verkäufe)
- Skaliere Kapazität vor erwarteten Spitzen vor
- Richte Auto-Skalierungs-Trigger ein
Kosten höher als erwartet
Kosten höher als erwartet
Diagnose:
- Überprüfe Abrechnung → Nutzung für Aufschlüsselung:
- Modell-API-Kosten
- Telefonie-Minuten
- Speicherkosten
- Premium-Funktionen (ML-AMD usw.)
- Durchschnittlicher Anruf >10 Minuten (typisch ist 3-5 Min.)
- Ursache: Agent zu wortreich, Schleifen, beendet Anrufe nicht
- Lösung: Anrufdauerziele hinzufügen, Timeout aktivieren
- GPT-4 für einfache FAQ-Anrufe verwenden
- Lösung: Zu GPT-3.5 Turbo wechseln (3x günstiger)
- AMD nicht verwenden, volle Minuten für Voicemails berechnen
- Lösung: Textbasiertes AMD aktivieren (kostenlos) oder ML-AMD (+0,01€/Anruf, spart aber 0,50€+/VM)
- Premium-Transkribierer für alle Anrufe verwenden
- Lösung: Standard-Transkribierer verwenden, außer Genauigkeit ist kritisch
- AMD für ausgehende Kampagnen aktivieren
- Max. Anrufdauer festlegen (z. B. 15 Minuten)
- Günstigeres Modell für einfache Anrufe verwenden
- Audioaufnahmen komprimieren (niedrigere Bitrate)
- Alte Aufnahmen nach 30 Tagen automatisch löschen
Debugging-Tools & Techniken
Protokollanalyse
Zugriff auf Protokolle:- Gespräche → Filter verwenden:
- Status: Fehlgeschlagen
- Datumsbereich: Letzte 24 Stunden
- Agent: Spezifischer Agent
- Fehlertyp: Spezifischer Fehler
Live-Debugging
Flüstermodus:- Live-Anruf beitreten, ohne dass Kunde hört
- Agent durch Flüstern von Anweisungen leiten
- Transkript in Echtzeit sehen
- Öffne Gespräche → Live-Monitor
- Finde aktiven Anruf
- Klicke auf Flüstern
- Sprich Anweisungen (Agent hört, Kunde nicht)
- Agent steckt fest → “Leite an Abrechnungsabteilung weiter”
- Agent kurz davor, falsche Info zu geben → “Überprüfe Wissensdatenbank für Preise”
- Grenzfall → Führe Agent durch ungewöhnliches Szenario
Testen in Produktion
Kanarienvogel-Anrufe:- Führe Testanrufe während Geschäftszeiten durch
- Verwende bekannte Szenarien
- Vergleiche mit erwartetem Verhalten
- Markiere als Test zum Filtern:
metadata: {test_call: true}
- Automatisierte Testanrufe jede Stunde
- Überprüfe, dass wichtige Abläufe noch funktionieren
- Alarmiere, wenn Tests zu scheitern beginnen
Wann Support kontaktieren
Kontaktiere support@itellico.ai wenn:- Plattformprobleme: Weitreichende Ausfälle, API-Fehler, die alle Agenten betreffen
- Sicherheitsvorfälle: Vermutete Verletzung, ungewöhnliche Zugriffsmuster
- Abrechnungsstreitigkeiten: Unerwartete Gebühren, Nutzungsdiskrepanzen
- Carrier-Probleme: SIP-Trunk registriert sich nicht, Nummernportierungsprobleme
- Fehlerberichte: Klare Plattformfehler (keine Konfigurationsprobleme)
- Agenten-ID und Anruf-IDs, die Problem zeigen
- Fehlermeldungen aus Protokollen
- Schritte zur Reproduktion
- Was du bereits versucht hast
- Geschäftliche Auswirkungen (wie viele Benutzer betroffen)
- Kritisch (Produktion ausgefallen): <1 Stunde
- Hoch (Hauptfunktion defekt): <4 Stunden
- Mittel (Workaround existiert): <24 Stunden
- Niedrig (Feature-Request, Frage): <48 Stunden