Überblick
DTMF-Steuerung (Dual-Tone Multi-Frequency) ermöglicht es deinen KI-Agenten, während Gesprächen sowohl Telefontastaturtöne zu senden als auch zu erfassen. Dies ermöglicht es Agenten, IVR-Systeme zu navigieren, mit veralteten Telefonsystemen zu interagieren und strukturierte Eingaben von Anrufern über Tastendruck zu sammeln - und verwandelt deinen Agenten von sprachbasiert zu einem vollwertigen Telefonautomatisierungssystem. DTMF-Fähigkeiten sind unerlässlich für die Integration von KI-Agenten in bestehende Geschäftstelefon-Infrastruktur, ermöglichen nahtlose Transfers durch komplexe IVR-Menüs und sammeln präzise numerische Eingaben wie Kontonummern, PIN-Codes oder Menüauswahlen.Was ist DTMF?
DTMF-Technologie verstehen
DTMF ist das Signal, das erzeugt wird, wenn du Tasten auf einer Telefontastatur drückst. Jede Taste erzeugt zwei simultane Töne mit unterschiedlichen Frequenzen - einen hohen und einen niedrigen - und erzeugt einen einzigartigen Klang, den Systeme dekodieren können, um zu identifizieren, welche Taste gedrückt wurde. Verfügbare Tasten:- Ziffern: 0-9 (numerische Eingabe)
- Stern: * (oft verwendet als “zurück” oder “abbrechen”)
- Raute/Hash: # (oft verwendet als “bestätigen” oder “eingeben”)
- IVR-Menüs navigieren (“Drücke 1 für Verkauf, 2 für Support”)
- Kontonummern oder PINs eingeben
- Aktionen bestätigen oder abbrechen
DTMF-Fähigkeiten
Zwei Hauptfunktionen
Töne senden
Töne erfassen
Anwendungsfälle für das Senden von Tönen
IVR-Navigation
IVR-Navigation
Authentifizierung
Authentifizierung
Systemintegration
Systemintegration
Anwendungsfälle für das Erfassen von Tönen
Menüauswahl
Menüauswahl
Informationserfassung
Informationserfassung
Tastaturgabe
Tastaturgabe
DTMF-Steuerung konfigurieren
Zugriff auf DTMF-Einstellungen
Zur DTMF-Konfiguration navigieren
DTMF aktivieren
Einstellungen konfigurieren


Globaler DTMF-Schalter
DTMF während Anrufen aktivieren Ermögliche dem Agenten, Tastaturtöne zu senden und Ziffern von Anrufern zu sammeln. Wann aktivieren:- Agent muss IVR-Systeme navigieren
- Agent muss strukturierte numerische Eingaben sammeln
- Integration erfordert DTMF-Interaktion
Konfiguration zum Senden von Tönen
Töne senden
Konfiguriere deinen Agenten, um DTMF-Töne an externe Systeme zu senden. Schalter: Erlaube dem Agenten, Tastaturtöne zu senden Parameter:- Abkühlzeit zwischen Tönen (Sekunden): 3 Sekunden (Standard)
- Tondauer (ms): 120 ms (Standard)
- Lücke zwischen Tönen (ms): 70 ms (Standard)
Parameter zum Senden von Tönen
Abkühlzeit zwischen Tönen (Sekunden)
Abkühlzeit zwischen Tönen (Sekunden)
- Erhöhen (4-5s): Langsame/Legacy-IVR-Systeme verpassen Töne
- Verringern (1-2s): Schnelle moderne Systeme, Gesamtnavigationszeit reduzieren
Tondauer (ms)
Tondauer (ms)
- Erhöhen (150-200ms): IVR-Systeme erkennen Töne nicht zuverlässig
- Verringern (80-100ms): Interaktionen beschleunigen, Latenz reduzieren
Lücke zwischen Tönen (ms)
Lücke zwischen Tönen (ms)
- Erhöhen (100-150ms): IVR behandelt schnelle Töne als einzelne Eingabe
- Verringern (40-50ms): Mehrziffrige Sequenzen beschleunigen
Empfohlene Einstellungen nach Anwendungsfall
Schnelle moderne IVRs
Schnelle moderne IVRs
- Abkühlzeit: 1-2 Sekunden
- Tondauer: 100ms
- Lücke zwischen Tönen: 50ms
Standard-IVRs (Standard)
Standard-IVRs (Standard)
- Abkühlzeit: 3 Sekunden (Standard)
- Tondauer: 120ms (Standard)
- Lücke zwischen Tönen: 70ms (Standard)
Langsame/problematische IVRs
Langsame/problematische IVRs
- Abkühlzeit: 4-5 Sekunden
- Tondauer: 150ms
- Lücke zwischen Tönen: 100ms
Konfiguration zur Tonerfassung
Erfassungsmodi
Wähle, wie dein Agent DTMF-Eingaben von Anrufern empfängt und interpretiert.Menü (Einzeltaste)
Collector (Mehrstellig)
Menümodus
Für IVR-ähnliche Menüauswahlen Der Menümodus erfasst einen einzelnen Tastendruck und sendet ihn sofort an den Agenten. Funktionsweise:- Agent gibt Menüoptionen vor
- Kunde drückt einzelne Taste (0-9, *, #)
- Agent empfängt Ziffer sofort
- Agent antwortet basierend auf gedrückter Taste
- Erfasst einzelnen Tastendruck
- Verarbeitet sofort
- Keine Abschlusstaste erforderlich
- Löschtaste nicht verfügbar
Collector-Modus
Für das Sammeln von Sequenzen wie Kontonummern, PINs, Telefonnummern Der Collector-Modus puffert mehrere Ziffern, bis der Benutzer die Abschlusstaste drückt oder das Timeout abläuft. Funktionsweise:- Agent fordert mehrstellige Eingabe an
- Kunde gibt mehrere Ziffern ein
- Drückt Abschlusstaste (normalerweise #) bei Abschluss
- Agent empfängt vollständige Ziffernfolge
- Minimale Ziffern: 1 (Standard)
- Maximale Ziffern: 25 (Standard)
- Timeout (ms): 6000ms (6 Sekunden, Standard)
- Abschlusstaste: # (Raute)
- Eingabe löschen Taste: * (Stern)
Collector-Modus-Parameter
Minimale Ziffern
Minimale Ziffern
- Kontonummer (10 Ziffern): Auf 10 setzen
- PIN (4 Ziffern): Auf 4 setzen
- Flexible Eingabe: Auf 1 setzen (jede Länge akzeptiert)
- Wenn Kunde # vor Erreichen des Minimums drückt → Fehler, Aufforderung zur erneuten Eingabe
- Wenn Kunde Minimum erreicht → Kann # drücken, um vorzeitig zu übermitteln
Maximale Ziffern
Maximale Ziffern
- Telefonnummer: Auf 10 setzen (US-Format)
- Kontonummer: Auf erwartete Länge setzen
- Variable Länge: Höher als erwartet Maximum setzen
- Wenn maximale Ziffern eingegeben → Automatisch übermitteln ohne # erforderlich
- Töne nach Maximum werden ignoriert
Timeout (ms)
Timeout (ms)
- Timer startet nach jedem Zifferndruck
- Setzt mit jeder neuen Ziffer zurück
- Wenn Timeout erreicht → Als vollständig behandeln oder zur Fortsetzung auffordern
- Schnelle Eingabe (PIN): 3000-4000ms (3-4 Sekunden)
- Lange Eingabe (Kontonummer): 6000-8000ms (6-8 Sekunden)
- Geduldiges System: 10000ms+ (10+ Sekunden)
Abschlusstaste
Abschlusstaste
Eingabe löschen Taste
Eingabe löschen Taste
Empfohlene Collector-Einstellungen nach Anwendungsfall
Kontonummernerfassung (10 Ziffern)
Kontonummernerfassung (10 Ziffern)
- Minimale Ziffern: 10
- Maximale Ziffern: 10
- Abschlusstaste: # (optional, übermittelt automatisch bei 10)
- Timeout: 6000ms (6 Sekunden)
- Eingabe löschen Taste: *
PIN-Erfassung (4-6 Ziffern)
PIN-Erfassung (4-6 Ziffern)
- Minimale Ziffern: 4
- Maximale Ziffern: 6
- Abschlusstaste: #
- Timeout: 4000ms (4 Sekunden)
- Eingabe löschen Taste: *
Telefonnummer (Variables Format)
Telefonnummer (Variables Format)
- Minimale Ziffern: 7
- Maximale Ziffern: 15
- Abschlusstaste: #
- Timeout: 6000ms (6 Sekunden)
- Eingabe löschen Taste: *
Flexible numerische Eingabe (Standard)
Flexible numerische Eingabe (Standard)
- Minimale Ziffern: 1 (Standard)
- Maximale Ziffern: 25 (Standard)
- Abschlusstaste: #
- Timeout: 6000ms (6 Sekunden, Standard)
- Eingabe löschen Taste: *
DTMF in Anweisungen verwenden
Zur DTMF-Eingabe auffordern
Menüauswahlbeispiel:DTMF-Antworten behandeln
Automatische Verarbeitung: Wenn DTMF-Erfassung aktiviert ist, empfängt der Agent automatisch gesammelte Ziffern und kann darauf reagieren. Keine zusätzliche Konfiguration erforderlich. Erweitert: Verwendung des wait_for_dtmf_input-Tools Für explizite Kontrolle in deinen Agentenanweisungen kannst du daswait_for_dtmf_input-Tool aufrufen. Es gibt zurück:
Fallback auf Sprache
Sprachalternative anbieten:DTMF-Konfiguration testen
Testplan
Töne senden testen (IVR-Navigation)
- Agent mit Transfer-Aktion zu Telefonnummer mit IVR konfigurieren
- Anweisungen hinzufügen, um IVR mit DTMF-Tönen zu navigieren
- Testanruf starten
- Transfer-Aktion auslösen
- Agent beim Navigieren des IVR überwachen (Protokolle auf gesendete Töne prüfen)
- Überprüfen, ob Agent korrektes Ziel erreicht
- Töne in korrekten Intervallen gesendet
- IVR erkennt alle Töne
- Navigation wird erfolgreich abgeschlossen
- Keine verworfenen oder falsch interpretierten Töne
Menümodus testen (Einzeltastenerfassung)
- DTMF im Menümodus konfigurieren
- Menüoptionen zu Anweisungen hinzufügen
- Testanruf starten
- Menüoptionen anhören
- Einzelne Taste drücken (1, 2, 3, usw.)
- Überprüfen, ob Agent erkennt und angemessen reagiert
| Taste | Erwartete Aktion |
|---|---|
| 1 | Zu Option 1 weiterleiten |
| 2 | Zu Option 2 weiterleiten |
| 9 | Zu Option 9 weiterleiten |
| * | Sterntaste behandeln |
| # | Rautetaste behandeln |
| Ungültig | Fehlerbehandlung |
Collector-Modus testen (Mehrstellig)
- DTMF im Collector-Modus konfigurieren
- Angemessene min/max Ziffern, Abschlusstaste setzen
- Testanruf starten
- Agent auffordern, Ziffern zu sammeln
- Verschiedene Ziffernsequenzen eingeben:
- Genau minimale Ziffern + #
- Zwischen min und max Ziffern + #
- Genau maximale Ziffern (automatisch übermitteln)
- Löschtaste (*) zum Korrigieren von Fehlern verwenden
- Eingabe-Timeout ablaufen lassen
- Überprüfen, ob Agent korrekte Ziffernfolge erhält
- Minimale Zifferndurchsetzung funktioniert
- Maximale Ziffern automatisch übermitteln funktioniert
- Abschlusstaste finalisiert Eingabe ordnungsgemäß
- Löschtaste löscht letzte Ziffer korrekt
- Timeout-Behandlung angemessen
Grenzfälle testen
- Sofort # drücken (keine Ziffern)
- Sollte ablehnen, wenn min > 0
- Teilweise Ziffern eingeben, auf Timeout warten
- Angemessene Behandlung überprüfen
- Ziffern sehr schnell eingeben
- Überprüfen, ob alle korrekt erfasst
-
- bei leerem Puffer drücken (sollte ignorieren)
-
- mehrmals drücken (löscht mehrere Ziffern)
- Ziffern eingeben, alle löschen, neue Sequenz eingeben
- Tasten im falschen Modus drücken (z.B. # im Menümodus)
- Taste zu lange halten
- Mehrere Tasten gleichzeitig drücken
Integration mit Anweisungen testen
- Agent fordert ordnungsgemäß zur DTMF-Eingabe auf
- Agent wartet auf Eingabe (spricht nicht weiter)
- Agent bestätigt Empfang der Eingabe
- Agent verarbeitet erfassten Wert korrekt
- Agent behandelt ungültige Eingabe elegant
- Agent bietet bei Bedarf Sprach-Fallback an
Häufige Testprobleme
Töne nicht erkannt
Töne nicht erkannt
- DTMF-Unterstützung nicht global aktiviert
- Tondauer zu kurz für Erkennung
- Netzwerk-/Codec-Probleme verschlechtern Töne
- Anweisungen behandeln DTMF-Variable nicht
- Überprüfen, ob DTMF-Unterstützungsschalter EIN ist
- Tondauer auf 150-200ms erhöhen
- Von anderem Telefon/Netzwerk testen
- Protokolle prüfen, um zu bestätigen, dass
wait_for_dtmf_input-Tool registriert und aufgerufen wird - Überprüfe, ob
session.userdata.last_dtmf_inputin Worker-Protokollen gefüllt wird
Falsche Ziffern erfasst
Falsche Ziffern erfasst
- Zwischen-Ton-Lücke zu kurz (Töne vermischen sich)
- Hintergrundgeräusche erzeugen falsche Töne
- Kunde drückt Tasten zu schnell
- Zwischen-Ton-Lücke auf 100-150ms erhöhen
- In ruhiger Umgebung testen
- Timeout erhöhen, um Kundeneingabe zu verlangsamen
- Validierung und Bestätigung in Anweisungen hinzufügen
IVR-Navigation schlägt fehl
IVR-Navigation schlägt fehl
Löschtaste funktioniert nicht
Löschtaste funktioniert nicht
- Löschtaste nicht ordnungsgemäß konfiguriert
- Löschtaste im Menümodus gedrückt (nicht anwendbar)
- * als Abschlusstaste zugewiesen (Konflikt)
- Überprüfe, ob Löschtaste im Collector-Modus auf * gesetzt ist
- Stelle sicher, dass Modus Collector ist (Löschtaste funktioniert nur im Collector)
- Verwende * nicht als sowohl Lösch- als auch Abschlusstaste
Best Practices
Immer Sprach-Fallback anbieten
Immer Sprach-Fallback anbieten
- Mobiltelefone in Gebieten mit schlechtem Signal
- VoIP-Apps ohne Tastatur
- Barrierefreiheitsbedürfnisse
- Präferenz für Sprachinteraktion
Empfangene Eingabe bestätigen
Empfangene Eingabe bestätigen
Klare Anweisungen für DTMF-Aufforderungen
Klare Anweisungen für DTMF-Aufforderungen
- Was eingegeben werden soll (Kontonummer, PIN, Auswahl)
- Wie viele Ziffern (bei fester Länge)
- Abschlusstaste (falls zutreffend)
- Alternative Methode (Sprache)
Mit konservativem Timing beginnen
Mit konservativem Timing beginnen
- Mit empfohlenen Standards beginnen
- Für kleine Testgruppe bereitstellen
- Auf DTMF-Fehler in Protokollen überwachen
- Timing basierend auf tatsächlichen Fehlern anpassen
- Optimierte Einstellungen ausrollen
- Sehr schnelles Timing ohne Tests setzen
- Annehmen, dass alle IVRs sich gleich verhalten
- Für Geschwindigkeit statt Zuverlässigkeit optimieren
Wiederholungsversuche elegant behandeln
Wiederholungsversuche elegant behandeln
- Nach einmaligem Fehlschlag aufgeben
- Exakt gleiche Anweisungen wiederholen (nicht hilfreich)
- In unendlicher Wiederholungsschleife stecken bleiben