Zum Hauptinhalt springen

Diagnoseverfahren

Wenn Probleme in der Produktion auftreten, verwende diesen systematischen Fehlerbehebungsprozess:
  1. Symptome identifizieren - Was ist kaputt? Anrufe schlagen fehl, Agent verhält sich falsch, Integrationen sind ausgefallen?
  2. Umfang prüfen - Betrifft alle Anrufe oder nur eine bestimmte Teilmenge? Seit wann?
  3. Protokolle überprüfen - Suche nach Fehlermeldungen, Mustern, Stack Traces
  4. Ursache isolieren - Ist es ein Konfigurations-, Integrations-, Plattform- oder Carrier-Problem?
  5. Lösung anwenden - Stelle die kleinste Änderung bereit, die das Problem löst
  6. Validieren - Teste gründlich, bevor du es als gelöst markierst

Häufige Probleme & Lösungen

Keine Anrufe werden empfangen

Symptom: Telefonnummer klingelt nicht, Anrufe gehen ins Leere oder “Nummer nicht vergeben”
Diagnose:
  1. Gehe zu Telefonie → Telefonnummern
  2. Finde deine Nummer, überprüfe die Spalte “Zugewiesener Agent”
  3. Überprüfe, ob sie dem richtigen Agenten zugewiesen ist (nicht “Nicht zugewiesen”)
Lösung:
  • Klicke auf die Nummer → Wähle den Agenten aus dem Dropdown → Speichern
  • Warte 30 Sekunden, bis die Routing-Aktualisierung propagiert ist
  • Teste durch erneutes Anrufen der Nummer
Diagnose:
# SIP-Registrierungsstatus überprüfen
curl -H "Authorization: Bearer YOUR_API_KEY" \
     https://api.itellico.ai/v1/sip-trunks/trunk_123/status
Suche nach "status": "registered". Wenn "unregistered" oder "failed":Häufige Ursachen:
  • Falsche SIP-Anmeldedaten (Benutzername/Passwort)
  • IP nicht auf der Allowlist des Carriers
  • Firewall blockiert UDP 5060
  • Carrier-Endpunkt ist ausgefallen
Lösung:
  • Überprüfe Anmeldedaten beim Carrier
  • Überprüfe das Carrier-Portal für IP-Allowlist-Einstellungen
  • Teste mit curl -v sip:carrier.com:5060, um die Konnektivität zu überprüfen
  • Kontaktiere den Carrier, wenn ihr Endpunkt nicht erreichbar ist
Diagnose:
  • Nummernstatus zeigt “Ausstehend” oder “Fehlgeschlagen”
  • Nummer wurde gerade vor weniger als 5 Minuten gekauft
Lösung:
  • Warte bis zu 10 Minuten, bis die Bereitstellung abgeschlossen ist
  • Wenn länger als 30 Min. hängt, klicke auf “Bereitstellung wiederholen”
  • Wenn weiterhin fehlschlägt, kontaktiere den Support mit Nummerndetails
Diagnose:
  • Anrufe funktionieren, wenn SIE anrufen, aber nicht von Kundentelefonen
  • Bestimmte Vorwahlen oder Carrier können dich nicht erreichen
Lösung:
  • Überprüfe, ob die Routing-Tabelle des Carriers deinen Nummernbereich enthält
  • Überprüfe CNAM (Caller Name) Registrierung
  • Prüfe auf Spam-Kennzeichnung (verwende kostenlose Carrier-Lookup-Tools)
  • Möglicherweise musst du den Carrier kontaktieren, um das Routing zu korrigieren

Schlechte Anrufqualität

Symptom: Abgehackte Audio, Echo, roboterhafte Stimme, lange Verzögerungen
Diagnose:
  • Öffne Gespräche → Wähle betroffenen Anruf
  • Überprüfe “Anrufqualität”-Metriken:
    • Jitter: Sollte <30ms sein
    • Paketverlust: Sollte <1% sein
    • RTT (Round Trip Time): Sollte <200ms sein
Lösungen nach Symptom:
SymptomWahrscheinliche UrsacheLösung
EchoAkustisches Echo (Lautsprecher-Feedback)AEC in Agenteneinstellungen aktivieren
Abgehackt/RoboterhaftPaketverlust oder JitterNetzwerkbandbreite prüfen, Codec wechseln
AussetzerFirewall blockiert RTPUDP-Ports 10000-60000 öffnen
Einseitiges AudioNAT-Traversal-ProblemTURN-Relay aktivieren
HintergrundgeräuscheGeräuschvolle UmgebungRauschunterdrückung aktivieren
Konfiguration:
// Agenten-Audioeinstellungen
{
  "audio": {
    "echo_cancellation": true,
    "noise_suppression": true,
    "codec": "opus",  // Beste Qualität, Fallback auf PCMU
    "bitrate": 64000  // Höher = bessere Qualität (64kbps empfohlen)
  }
}
Diagnose:
  • Überprüfe Dashboard → Metriken → Durchschnittliche Antwortzeit
  • Zielwert: <500ms
  • Wenn >1000ms, untersuchen:
Mögliche Ursachen:
  1. Verlangsamung des Modellanbieters
    • Überprüfe status.openai.com oder status.anthropic.com
    • Suche nach erhöhten Latenzen oder Ausfällen
    • Wechsle zu Fallback-Modell, falls verfügbar
  2. Großes Kontextfenster
    • Lange Anweisungen oder riesige Wissensdatenbank-Abrufe
    • Lösung: Anweisungslänge reduzieren, KB-Chunks auf 3 begrenzen
  3. Langsame externe API
    • Überprüfe Analytik → Aktionen für langsame API-Aufrufe
    • APIs, die >2s benötigen, verzögern die Agentenantwort
    • Timeout-Limits und Fallback-Antworten hinzufügen
  4. Netzwerkprobleme
    • Von mehreren Standorten aus überprüfen
    • Wenn bestimmte Region betroffen ist, könnte es ein ISP-Routing-Problem sein
    • Kontaktiere den Support zur Untersuchung
Schnelle Lösung:
  • Wechsle zu schnellerem Modell (GPT-4 → GPT-3.5 Turbo)
  • Reduziere die Anzahl der abgerufenen Wissensdatenbank-Chunks
  • Erhöhe API-Timeouts, um Wartezeiten zu vermeiden
Diagnose:
  • Überprüfe Transkript in Gespräche
  • Suche nach Mustern:
    • Fachbegriffe falsch verstanden → Füge zu benutzerdefiniertem Vokabular hinzu
    • Akzente missverstanden → Probiere anderen Transkribierer aus
    • Hintergrundgeräusche → Aktiviere Rauschunterdrückung
Lösungen:Benutzerdefiniertes Vokabular hinzufügen:
// In Agenteneinstellungen → Transkribierer → Benutzerdefiniertes Vokabular
{
  "custom_words": [
    {"word": "itellicoAI", "pronunciation": "eye-TELL-ih-koh AI"},
    {"word": "Kubernetes", "pronunciation": "koo-ber-NET-eez"},
    {"word": "API", "pronunciation": "A P I"}  // Akronyme buchstabieren
  ]
}
Anderen Transkribierer ausprobieren:
  • Deepgram: Am besten für Akzente, geräuschvolle Umgebungen
  • Azure: Am besten für Fachbegriffe
  • Whisper: Am besten für mehrsprachig
Audio-Eingabe verbessern:
  • Höheren Bitrate-Codec verwenden (Opus 64kbps)
  • Rauschunterdrückung aktivieren
  • Mit anderem Telefon/Mikrofon für Web-Anrufe testen

Agent antwortet nicht korrekt

Symptom: Agent gibt falsche Antworten, ignoriert Anweisungen, verhält sich unberechenbar
Diagnose:
  • Öffne Agenteneinstellungen → Konversation → Anweisungen
  • Teste im Simulator mit genauem Szenario
  • Prüfe, ob das Problem:
    • Immer auftritt → Anweisungsproblem
    • Intermittierend → Kontext- oder Modellproblem
Lösungen:1. Anweisungen zu vage:
❌ Schlecht: "Seien Sie hilfreich und beantworten Sie Fragen."

✅ Gut: "Sie sind der Support von Acme Corp. Beantworten Sie Fragen zu:
- Produktfunktionen (siehe Wissensdatenbank)
- Preise (aktuelle Pläne: Basic 49€, Pro 99€)
- Abrechnung (an Abrechnungsabteilung weiterleiten)

Beantworten Sie KEINE Fragen zu:
- Wettbewerbsvergleichen
- Zukünftiger Roadmap
- Rechtlichem/Compliance"
2. Anweisungen zu lang (>500 Wörter):
  • Modell verliert Fokus bei langen Prompts
  • Lösung: In klare Abschnitte unterteilen, Aufzählungszeichen verwenden
3. Widersprüchliche Anweisungen:
  • Beispiel: “Sei prägnant” aber auch “Gib detaillierte Erklärungen”
  • Lösung: Ein Verhalten priorisieren, Konflikt entfernen
Testen:
  • Führe 10 Testanrufe mit Grenzfällen durch
  • Überprüfe Transkripte auf Compliance
  • Iteriere Anweisungen basierend auf Fehlern
Diagnose:
  • Agent sagt Dinge, die nicht in der Wissensdatenbank oder den Anweisungen stehen
  • Liefert falsche Produktdetails, Preise oder Richtlinien
Grundursachen:
  1. Wissensdatenbank nicht umfassend genug
  2. Anweisungen betonen nicht “nur bereitgestellte Informationen verwenden”
  3. Modell zu kreativ (Temperatur zu hoch)
Lösungen:1. Explizite Leitplanken hinzufügen:
KRITISCH: Geben Sie nur Informationen aus:
1. Der Wissensdatenbank
2. Den obigen Anweisungen
3. Informationen, die der Anrufer bereitstellt

Wenn Sie etwas nicht wissen, sagen Sie: "Ich habe diese Information nicht. Lassen Sie mich Sie an jemanden weiterleiten, der helfen kann."

Erfinden Sie NIEMALS Fakten, Preise oder Richtlinien.
2. Wissensdatenbank erweitern:
  • Überprüfe “Ich weiß nicht”-Antworten in Protokollen
  • Füge fehlende Inhalte zu KB hinzu
  • Teste Abruf mit Beispielabfragen
3. Modelltemperatur senken:
{
  "model_settings": {
    "temperature": 0.3  // Niedriger = deterministischer (Standard: 0.7)
  }
}
4. Zitiermodus verwenden (falls verfügbar):
  • Zwingt Agent, KB-Quellen zu zitieren
  • Macht offensichtlich, wenn Info nicht in KB
Diagnose:
  • Agent wiederholt dieselbe Frage 3+ Mal
  • Konversation dreht sich im Kreis
  • Anrufer wird frustriert
Grundursachen:
  1. Agent erkennt nicht, dass Anrufer geantwortet hat
  2. Transkription fehlgeschlagen (Antwort nicht gehört)
  3. Anweisungen behandeln Grenzfall nicht
Lösungen:1. Schleifenerkennung hinzufügen:
Wenn Sie dieselbe Frage zweimal gestellt haben und der Kunde verwirrt scheint,
versuchen Sie, die Frage umzuformulieren oder bieten Sie an, an einen Menschen weiterzuleiten.

Beispiel:
Agent: "Was ist Ihre Konto-E-Mail?"
Anrufer: [unklare Antwort]
Agent: "Ich habe das nicht ganz verstanden. Unter welcher E-Mail-Adresse läuft Ihr Konto?"
Anrufer: [immer noch unklar]
Agent: "Ich habe Schwierigkeiten zu hören. Lassen Sie mich Sie mit jemandem verbinden, der helfen kann."
2. Absichtserkennung verbessern:
  • Füge Beispiele für Grenzfallantworten zu Anweisungen hinzu
  • Verwende strukturierte Antworten (DTMF für kritische Infos)
  • Aktiviere “Ich bin mir nicht sicher”-Fallback zu Mensch
3. Grenzfälle testen:
  • Schweigender Anrufer
  • Weitschweifiger Anrufer
  • Anrufer mit starkem Akzent
  • Geräuschvolle Umgebung

Integrationsfehler

Symptom: Aktionen werden nicht ausgelöst, API-Aufrufe schlagen fehl, Weiterleitungen funktionieren nicht
Diagnose:
  1. Öffne Gespräche → Wähle fehlgeschlagenen Anruf
  2. Navigiere zum Tab Aktionen
  3. Suche nach Fehlermeldung (z. B. “API-Timeout”, “401 Unauthorized”)
Häufige Fehler & Lösungen:
FehlerUrsacheLösung
401 UnauthorizedFalscher API-SchlüsselSchlüssel neu generieren, Agentenkonfiguration aktualisieren
403 ForbiddenBerechtigungsproblemAgent Zugriff auf Ressource gewähren
404 Not FoundFalsche Endpunkt-URLURL in Aktionskonfiguration überprüfen
408 TimeoutAPI zu langsamTimeout erhöhen (Standard 5s → 10s)
500 Internal Server ErrorExterne API ausgefallenAPI-Statusseite prüfen, Wiederholungslogik hinzufügen
SSL Certificate ErrorHTTPS-ProblemZertifikat gültig, nicht abgelaufen überprüfen
Testen:
# API-Endpunkt manuell testen
curl -X POST https://api.example.com/action \
     -H "Authorization: Bearer YOUR_KEY" \
     -H "Content-Type: application/json" \
     -d '{"test": "data"}'
Wenn manueller Curl funktioniert, aber Agent fehlschlägt, überprüfe:
  • IP-Allowlisting (Agenten-IPs müssen möglicherweise auf Allowlist gesetzt werden)
  • Rate-Limiting (Agent kann Limits schneller erreichen als manuelles Testen)
Diagnose:
  • Agent sagt “Weiterleitung…” aber Anruf bricht ab oder nichts passiert
  • Überprüfe Protokolle → Aktionen für Weiterleitungsstatus
Häufige Probleme:1. Ungültige Weiterleitungsnummer:
  • Überprüfe Nummernformat (muss E.164 sein: +1234567890)
  • Überprüfe, ob Nummer erreichbar ist (rufe manuell an)
2. SIP-Reinvite-Fehler:
  • Einige Carrier unterstützen SIP REFER für Weiterleitungen nicht
  • Lösung: Verwende “Betreute Weiterleitung” statt “Blindweiterleitung”
  • Oder aktiviere “Anruf-Bridging”-Modus
3. Carrier unterstützt keine Weiterleitungen:
  • Prüfe bei Carrier, ob Weiterleitungen aktiviert sind
  • Möglicherweise musst du SIP-Trunk upgraden, um zu unterstützen
Konfiguration:
{
  "transfer": {
    "type": "attended",  // Zuverlässiger als "blind"
    "timeout": 30,       // Sekunden bis Antwort warten
    "announcement": "Ich verbinde Sie jetzt..."
  }
}
Diagnose:
  • Agent sagt “Ich weiß nicht”, wenn Antwort in KB ist
  • Teste Abruf manuell:
# KB-Suche testen
curl -X POST https://api.itellico.ai/v1/knowledge-bases/kb_123/search \
     -H "Authorization: Bearer YOUR_API_KEY" \
     -d '{"query": "was ist Ihre Rückerstattungsrichtlinie"}'
Häufige Ursachen:1. KB nicht mit Agent verknüpft:
  • Überprüfe Agenteneinstellungen → Wissen → KB zugewiesen überprüfen
2. Inhalt nicht indiziert:
  • Kürzlich hochgeladener Inhalt benötigt 2-5 Minuten zum Indizieren
  • Überprüfe, dass KB-Status “Indiziert” zeigt, nicht “Verarbeitung läuft”
3. Abfrage stimmt nicht mit Inhalt überein:
  • Kunde fragt “Kann ich Geld zurückbekommen?” aber KB sagt “Rückerstattungsrichtlinie”
  • Lösung: Synonyme hinzufügen, KB-Inhalt umschreiben, um gängige Formulierungen zu entsprechen
4. Abrufeinstellungen zu restriktiv:
  • Minimale Ähnlichkeitsschwelle zu hoch (z. B. 0,9)
  • Lösung: Auf 0,7-0,8 senken
Konfiguration:
{
  "knowledge_retrieval": {
    "min_similarity": 0.75,  // Niedriger = permissiver
    "max_chunks": 5,         // Mehr Chunks abrufen
    "rerank": true           // Nach Relevanz neu ordnen
  }
}

Kapazität & Leistung

Symptom: Besetztzeichen, Anrufe minutenlang in Warteschlange, “Alle Agenten beschäftigt”-MeldungDiagnose:
  • Überprüfe Dashboard → Kapazität für aktuelle/max Gleichzeitigkeit
  • Anrufvolumen-Diagramm für Spitzenzeiten überprüfen
Kurzfristige Lösungen:
  1. Warteschlange aktivieren: Lass Anrufer warten statt Besetztzeichen
  2. Überlauf-Agent hinzufügen: Leite bei Kapazität an Backup-Agent weiter
  3. Geschäftszeiten erweitern: Verteile Volumen über mehr Stunden
  4. Rückruf anbieten: “Wir rufen dich in 10 Minuten zurück”
Langfristige Lösungen:
  1. Plan upgraden: Erhöhe Limit für gleichzeitige Anrufe
  2. Lastverteilung: Erstelle mehrere Agenten, verteile Nummern
  3. Auto-Skalierung: Aktiviere dynamische Kapazitätsskalierung (Enterprise)
  4. Außerhalb der Spitzenzeiten Anreize: Fördere Anrufe während verkehrsschwacher Zeiten
Symptom: Anrufe brauchen länger zum Verbinden, Warteschlange baut sich auf, Fehler steigen sprunghaftDiagnose:
  • Plötzlicher Verkehrsspike (3x+ normales Volumen)
  • Überprüfe auf:
    • Marketingkampagne gestartet?
    • Medienerwähnung / viraler Beitrag?
    • Systemausfall verursacht Wiederholungssturm?
Sofortmaßnahmen:
  1. Rate-Limit: Reduziere vorübergehend max. gleichzeitige Anrufe, um zu stabilisieren
  2. Aggressiv in Warteschlange: Halte Anrufe statt fallen lassen
  3. Fallback-Nachricht: “Ungewöhnlich hohes Volumen. Bitte versuche es in 15 Minuten erneut.”
  4. Notfall-Skalierung: Kontaktiere Support für vorübergehende Kapazitätserhöhung
Prävention:
  • Sage Verkehr für bekannte Ereignisse vorher (Produkteinführungen, Verkäufe)
  • Skaliere Kapazität vor erwarteten Spitzen vor
  • Richte Auto-Skalierungs-Trigger ein
Diagnose:
  • Überprüfe Abrechnung → Nutzung für Aufschlüsselung:
    • Modell-API-Kosten
    • Telefonie-Minuten
    • Speicherkosten
    • Premium-Funktionen (ML-AMD usw.)
Häufige Übeltäter:1. Lange Anrufdauer:
  • Durchschnittlicher Anruf >10 Minuten (typisch ist 3-5 Min.)
  • Ursache: Agent zu wortreich, Schleifen, beendet Anrufe nicht
  • Lösung: Anrufdauerziele hinzufügen, Timeout aktivieren
2. Teures Modell:
  • GPT-4 für einfache FAQ-Anrufe verwenden
  • Lösung: Zu GPT-3.5 Turbo wechseln (3x günstiger)
3. Hohe Voicemail-Kosten:
  • AMD nicht verwenden, volle Minuten für Voicemails berechnen
  • Lösung: Textbasiertes AMD aktivieren (kostenlos) oder ML-AMD (+0,01€/Anruf, spart aber 0,50€+/VM)
4. Teure Transkription:
  • Premium-Transkribierer für alle Anrufe verwenden
  • Lösung: Standard-Transkribierer verwenden, außer Genauigkeit ist kritisch
Optimierungs-Checkliste:
  • AMD für ausgehende Kampagnen aktivieren
  • Max. Anrufdauer festlegen (z. B. 15 Minuten)
  • Günstigeres Modell für einfache Anrufe verwenden
  • Audioaufnahmen komprimieren (niedrigere Bitrate)
  • Alte Aufnahmen nach 30 Tagen automatisch löschen

Debugging-Tools & Techniken

Protokollanalyse

Zugriff auf Protokolle:
# Protokolle über API exportieren
curl -H "Authorization: Bearer YOUR_API_KEY" \
     "https://api.itellico.ai/v1/conversations?start_date=2024-01-01&end_date=2024-01-02" \
     > logs.json

# Nach Fehlern filtern
cat logs.json | jq '.[] | select(.error != null)'

# Häufige Fehlermuster finden
cat logs.json | jq '.error.type' | sort | uniq -c | sort -rn
Web-Dashboard:
  • Gespräche → Filter verwenden:
    • Status: Fehlgeschlagen
    • Datumsbereich: Letzte 24 Stunden
    • Agent: Spezifischer Agent
    • Fehlertyp: Spezifischer Fehler

Live-Debugging

Flüstermodus:
  • Live-Anruf beitreten, ohne dass Kunde hört
  • Agent durch Flüstern von Anweisungen leiten
  • Transkript in Echtzeit sehen
Schritte:
  1. Öffne Gespräche → Live-Monitor
  2. Finde aktiven Anruf
  3. Klicke auf Flüstern
  4. Sprich Anweisungen (Agent hört, Kunde nicht)
Anwendungsfälle:
  • Agent steckt fest → “Leite an Abrechnungsabteilung weiter”
  • Agent kurz davor, falsche Info zu geben → “Überprüfe Wissensdatenbank für Preise”
  • Grenzfall → Führe Agent durch ungewöhnliches Szenario

Testen in Produktion

Kanarienvogel-Anrufe:
  • Führe Testanrufe während Geschäftszeiten durch
  • Verwende bekannte Szenarien
  • Vergleiche mit erwartetem Verhalten
  • Markiere als Test zum Filtern: metadata: {test_call: true}
Synthetisches Monitoring:
  • Automatisierte Testanrufe jede Stunde
  • Überprüfe, dass wichtige Abläufe noch funktionieren
  • Alarmiere, wenn Tests zu scheitern beginnen
# Automatisiertes Testskript
import requests
import time

def run_test_call():
    response = requests.post(
        'https://api.itellico.ai/v1/calls',
        headers={'Authorization': f'Bearer {API_KEY}'},
        json={
            'agent_id': 'agent_123',
            'to_number': '+1234567890',  # Ihre Testnummer
            'from_number': '+1987654321',
            'metadata': {'test_call': True, 'scenario': 'pricing_inquiry'}
        }
    )
    return response.json()

# Jede Stunde ausführen
while True:
    result = run_test_call()
    if result.get('status') != 'success':
        send_alert(f"Testanruf fehlgeschlagen: {result}")
    time.sleep(3600)

Wann Support kontaktieren

Kontaktiere support@itellico.ai wenn:
  • Plattformprobleme: Weitreichende Ausfälle, API-Fehler, die alle Agenten betreffen
  • Sicherheitsvorfälle: Vermutete Verletzung, ungewöhnliche Zugriffsmuster
  • Abrechnungsstreitigkeiten: Unerwartete Gebühren, Nutzungsdiskrepanzen
  • Carrier-Probleme: SIP-Trunk registriert sich nicht, Nummernportierungsprobleme
  • Fehlerberichte: Klare Plattformfehler (keine Konfigurationsprobleme)
In Support-Anfrage einschließen:
  • Agenten-ID und Anruf-IDs, die Problem zeigen
  • Fehlermeldungen aus Protokollen
  • Schritte zur Reproduktion
  • Was du bereits versucht hast
  • Geschäftliche Auswirkungen (wie viele Benutzer betroffen)
Antwortzeiten:
  • Kritisch (Produktion ausgefallen): <1 Stunde
  • Hoch (Hauptfunktion defekt): <4 Stunden
  • Mittel (Workaround existiert): <24 Stunden
  • Niedrig (Feature-Request, Frage): <48 Stunden

Nächste Schritte