Approche diagnostique
Lorsque des problèmes surviennent en production, Utilise ce processus de dépannage systématique :- Identifier les symptômes - Qu’est-ce qui est cassé ? Appels échouent, agent se comporte mal, intégrations en panne ?
- Vérifier la portée - Affecte tous les appels ou un sous-ensemble spécifique ? Commencé quand ?
- Examiner les journaux - Rechercher les messages d’erreur, les modèles, les traces de pile
- Isoler la cause - Est-ce un problème de configuration, d’intégration, de plateforme ou d’opérateur ?
- Appliquer la correction - Déployer la plus petite modification qui résout le problème
- Valider - Tester minutieusement avant de marquer comme résolu
Problèmes courants et solutions
Aucun appel n’est reçu
Symptôme : Le numéro de téléphone ne sonne pas, les appels vont au silence ou “numéro hors service”Vérifier l'attribution du numéro de téléphone
Vérifier l'attribution du numéro de téléphone
Diagnostic :
- Aller dans Téléphonie → Numéros
- Trouver ton numéro, vérifier la colonne “Agent attribué”
- Vérifier qu’il est attribué au bon agent (pas “Non attribué”)
- Cliquer sur le numéro → Sélectionner l’agent dans le menu déroulant → Enregistrer
- Attendre 30 secondes pour que la mise à jour du routage se propage
- Tester en appelant à nouveau le numéro
Vérifier l'enregistrement du trunk SIP
Vérifier l'enregistrement du trunk SIP
Diagnostic :Recherche
"status": "registered". Si "unregistered" ou "failed" :Causes courantes :- Mauvais identifiants SIP (nom d’utilisateur/mot de passe)
- IP non autorisée chez l’opérateur
- Pare-feu bloquant UDP 5060
- Point de terminaison de l’opérateur en panne
- Vérifier les identifiants auprès de l’opérateur
- Vérifier le portail de l’opérateur pour les paramètres de liste d’autorisation IP
- Tester avec
curl -v sip:carrier.com:5060pour vérifier la connectivité - Contacter l’opérateur si leur point de terminaison est inaccessible
Vérifier le provisionnement du numéro
Vérifier le provisionnement du numéro
Diagnostic :
- Le statut du numéro indique “En attente” ou “Échec”
- Le numéro a été acheté il y a moins de 5 minutes
- Attendre jusqu’à 10 minutes pour que le provisionnement se termine
- Si bloqué >30 min, cliquer sur “Réessayer le provisionnement”
- Si toujours en échec, contacter le support avec les détails du numéro
Problèmes de routage de l'opérateur
Problèmes de routage de l'opérateur
Diagnostic :
- Les appels fonctionnent quand Tu appelles, mais pas depuis les téléphones des clients
- Des indicatifs régionaux ou opérateurs spécifiques ne peuvent pas vous joindre
- Vérifier que la table de routage de l’opérateur inclut ton plage de numéros
- Vérifier l’enregistrement CNAM (Caller Name)
- Vérifier le marquage spam (utiliser des outils de recherche d’opérateur gratuits)
- Peut nécessiter de contacter l’opérateur pour corriger le routage
Mauvaise qualité d’appel
Symptôme : Audio haché, écho, voix robotique, longs délaisProblèmes audio (écho, bruit, coupures)
Problèmes audio (écho, bruit, coupures)
Diagnostic :
Configuration :
- Ouvrir Conversations → Journaux → Sélectionner l’appel affecté
- Vérifier les métriques “Qualité d’appel” :
- Jitter : Devrait être <30ms
- Perte de paquets : Devrait être <1%
- RTT (temps aller-retour) : Devrait être <200ms
| Symptôme | Cause probable | Correction |
|---|---|---|
| Écho | Écho acoustique (retour haut-parleur) | Activer AEC dans les paramètres de l’agent |
| Haché/Robotique | Perte de paquets ou jitter | Vérifier la bande passante réseau, changer de codec |
| Coupures | Pare-feu bloquant RTP | Ouvrir les ports UDP 10000-60000 |
| Audio unidirectionnel | Problème de traversée NAT | Activer le relais TURN |
| Bruit de fond | Environnement bruyant | Activer la suppression du bruit |
Latence élevée (l'agent répond lentement)
Latence élevée (l'agent répond lentement)
Diagnostic :
- Vérifier Tableau de bord → Métriques → Temps de réponse moyen
- Objectif : <500ms
- Si >1000ms, enquêter :
-
Ralentissement du fournisseur de modèle
- Vérifier status.openai.com ou status.anthropic.com
- Rechercher des latences élevées ou des pannes
- Basculer vers le modèle de secours si disponible
-
Grande fenêtre de contexte
- Longues instructions ou récupérations massives de base de connaissances
- Solution : Réduire la longueur des instructions, limiter les chunks KB à 3
-
Lenteur de l’API externe
- Vérifier Analytique → Actions pour les appels API lents
- Les API prenant >2s retarderont la réponse de l’agent
- Ajouter des limites de délai d’attente et des réponses de secours
-
Problèmes réseau
- Vérifier depuis plusieurs emplacements
- Si une région spécifique est affectée, peut être un problème de routage FAI
- Contacter le support pour enquêter
- Passer à un modèle plus rapide (GPT-4 → GPT-3.5 Turbo)
- Réduire le nombre de chunks de base de connaissances récupérés
- Augmenter les délais d’attente API pour éviter l’attente
Erreurs de transcription (mots incorrects)
Erreurs de transcription (mots incorrects)
Diagnostic :Essayer un autre transcripteur :
- Examiner la transcription dans Conversations → Journaux
- Rechercher des modèles :
- Termes techniques mal entendus → Ajouter au vocabulaire personnalisé
- Accents mal compris → Essayer un autre transcripteur
- Bruit de fond → Activer la suppression du bruit
- Deepgram : Meilleur pour les accents, environnements bruyants
- Azure : Meilleur pour les termes techniques
- Whisper : Meilleur pour le multilingue
- Utiliser un codec à débit binaire plus élevé (Opus 64kbps)
- Activer la suppression du bruit
- Tester avec un téléphone/micro différent pour les appels web
L’agent ne répond pas correctement
Symptôme : L’agent donne de mauvaises réponses, ignore les instructions, se comporte de manière erratiqueL'agent ne suit pas les instructions
L'agent ne suit pas les instructions
Diagnostic :2. Instructions trop longues (>500 mots) :
- Ouvrir les paramètres de l’agent → Conversation → Instructions
- Tester dans le simulateur avec le scénario exact
- Vérifier si le problème est :
- Toujours présent → Problème d’instructions
- Intermittent → Problème de contexte ou de modèle
- Le modèle perd le focus sur les prompts longs
- Solution : Diviser en sections claires, utiliser des puces
- Exemple : “Soyez concis” mais aussi “Fournis des explications détaillées”
- Solution : Prioriser un comportement, supprimer le conflit
- Exécuter 10 appels de test couvrant les cas limites
- Examiner les transcriptions pour la conformité
- Itérer les instructions en fonction des échecs
L'agent hallucine ou invente des faits
L'agent hallucine ou invente des faits
Diagnostic :2. Élargir la base de connaissances :4. Utiliser le mode citation (si disponible) :
- L’agent dit des choses qui ne sont pas dans la base de connaissances ou les instructions
- Fournit de mauvais détails de produit, prix ou politiques
- Base de connaissances pas assez complète
- Les instructions n’insistent pas sur “utiliser uniquement les informations fournies”
- Modèle trop créatif (température trop élevée)
- Examiner les réponses “Je ne sais pas” dans les journaux
- Ajouter le contenu manquant à la KB
- Tester la récupération avec des requêtes d’exemple
- Force l’agent à citer les sources KB
- Rend évident quand l’info n’est pas dans la KB
L'agent reste bloqué dans des boucles
L'agent reste bloqué dans des boucles
Diagnostic :2. Améliorer la reconnaissance d’intention :
- L’agent répète la même question 3+ fois
- La conversation tourne en rond
- L’appelant devient frustré
- L’agent ne reconnaît pas que l’appelant a répondu
- La transcription a échoué (n’a pas entendu la réponse)
- Les instructions ne gèrent pas le cas limite
- Ajouter des exemples de réponses de cas limites aux instructions
- Utiliser des réponses structurées (DTMF pour les infos critiques)
- Activer le repli “Je ne suis pas sûr” vers l’humain
- Appelant silencieux
- Appelant bavard
- Appelant avec accent prononcé
- Environnement bruyant
Échecs d’intégration
Symptôme : Les actions ne se déclenchent pas, les appels API échouent, les transferts ne fonctionnent pasL'action API échoue
L'action API échoue
Diagnostic :
Tests :Si curl manuel fonctionne mais l’agent échoue, vérifier :
- Ouvrir Conversations → Journaux → Sélectionner l’appel échoué
- Navigue vers l’onglet Actions
- Rechercher le message d’erreur (par ex. “Délai d’attente API”, “401 Non autorisé”)
| Erreur | Cause | Correction |
|---|---|---|
401 Unauthorized | Mauvaise clé API | Régénérer la clé, mettre à jour la config de l’agent |
403 Forbidden | Problème de permissions | Accorder à l’agent l’accès à la ressource |
404 Not Found | Mauvaise URL de point de terminaison | Vérifier l’URL dans la configuration de l’action |
408 Timeout | API trop lente | Augmenter le délai d’attente (défaut 5s → 10s) |
500 Internal Server Error | API externe en panne | Vérifier la page de statut de l’API, ajouter une logique de réessai |
SSL Certificate Error | Problème HTTPS | Vérifier que le certificat est valide, non expiré |
- Liste d’autorisation IP (les IP de l’agent peuvent nécessiter d’être autorisées)
- Limitation de débit (l’agent peut atteindre les limites plus rapidement que les tests manuels)
Le transfert échoue
Le transfert échoue
Diagnostic :
- L’agent dit “Transfert…” mais l’appel tombe ou rien ne se passe
- Vérifier Journaux → Actions pour le statut de transfert
- Vérifier le format du numéro (doit être E.164 : +1234567890)
- Vérifier que le numéro est joignable (l’appeler manuellement)
- Certains opérateurs ne prennent pas en charge SIP REFER pour les transferts
- Solution : Utiliser “transfert assisté” au lieu de “transfert aveugle”
- Ou activer le mode “pontage d’appel”
- Vérifier auprès de l’opérateur si les transferts sont activés
- Peut nécessiter de mettre à niveau le trunk SIP pour prendre en charge
La base de connaissances ne récupère pas
La base de connaissances ne récupère pas
Diagnostic :Causes courantes :1. KB non liée à l’agent :
- L’agent dit “Je ne sais pas” alors que la réponse est dans la KB
- Tester la récupération manuellement :
- Vérifier les paramètres de l’agent → Connaissances → Vérifier que la KB est attribuée
- Le contenu récemment téléchargé prend 2-5 minutes pour s’indexer
- Vérifier que le statut de la KB indique “Indexé” et non “En traitement”
- Le client demande “Puis-je être remboursé ?” mais la KB dit “Politique de remboursement”
- Solution : Ajouter des synonymes, réécrire le contenu de la KB pour correspondre aux formulations courantes
- Seuil de similarité minimal trop élevé (par ex. 0,9)
- Solution : Baisser à 0,7-0,8
Capacité et performance
Atteinte des limites de concurrence
Atteinte des limites de concurrence
Symptôme : Signal occupé, appels mis en file d’attente pendant des minutes, message “Tous les agents sont occupés”Diagnostic :
- Vérifier Tableau de bord → Capacité pour la concurrence actuelle/max
- Examiner le graphique du volume d’appels pour les heures de pointe
- Activer la file d’attente : Laisser les appelants attendre au lieu du signal occupé
- Ajouter un agent de débordement : Router vers un agent de secours lorsque le principal est à capacité
- Étendre les heures d’ouverture : Répartir le volume sur plus d’heures
- Offrir un rappel : “Nous vous rappellerons dans 10 minutes”
- Mettre à niveau le plan : Augmenter la limite d’appels simultanés
- Équilibrage de charge : Créer plusieurs agents, distribuer les numéros
- Mise à l’échelle automatique : Activer la mise à l’échelle dynamique de la capacité (Entreprise)
- Incitatifs hors pointe : Encourager les appels pendant les périodes de faible trafic
Volume d'appels élevé submerge le système
Volume d'appels élevé submerge le système
Symptôme : Les appels prennent plus de temps à se connecter, la file d’attente augmente, les erreurs augmententDiagnostic :
- Pic de trafic soudain (3x+ volume normal)
- Vérifier pour :
- Campagne marketing lancée ?
- Mention médiatique / publication virale ?
- Panne du système causant une tempête de réessais ?
- Limitation de débit : Réduire temporairement les appels simultanés max pour stabiliser
- File d’attente agressive : Retenir les appels au lieu de les abandonner
- Message de secours : “Volume inhabituellement élevé. Veuillez réessayer dans 15 minutes.”
- Mise à l’échelle d’urgence : Contacter le support pour une augmentation temporaire de la capacité
- Prévoir le trafic pour les événements connus (lancements de produits, ventes)
- Pré-échelle la capacité avant les pics attendus
- Configurer des déclencheurs de mise à l’échelle automatique
Coûts plus élevés que prévu
Coûts plus élevés que prévu
Diagnostic :
- Vérifier Facturation → Utilisation pour la répartition :
- Coûts de l’API du modèle
- Minutes de téléphonie
- Coûts de stockage
- Fonctionnalités premium (ML-AMD, etc.)
- Appel moyen >10 minutes (typique est 3-5 min)
- Cause : Agent trop verbeux, boucles, ne termine pas les appels
- Correction : Ajouter des objectifs de durée d’appel, activer le délai d’expiration
- Utiliser GPT-4 pour de simples appels FAQ
- Correction : Passer à GPT-3.5 Turbo (3x moins cher)
- Ne pas utiliser AMD, facturer des minutes complètes pour les messageries vocales
- Correction : Activer AMD textuel (gratuit) ou ML-AMD (+0,01€/appel mais économise 0,50€+/VM)
- Utiliser un transcripteur premium pour tous les appels
- Correction : Utiliser un transcripteur standard sauf si la précision est critique
- Activer AMD pour les campagnes sortantes
- Définir la durée d’appel max (par ex. 15 minutes)
- Utiliser un modèle moins cher pour les appels simples
- Compresser les enregistrements audio (débit binaire plus faible)
- Supprimer automatiquement les anciens enregistrements après 30 jours
Outils et techniques de débogage
Analyse des journaux
Accès aux journaux :- Conversations → Journaux → Utiliser les filtres :
- Statut : Échec
- Plage de dates : Dernières 24 heures
- Agent : agent spécifique
- Type d’erreur : erreur spécifique
Débogage en direct
Mode chuchotement :- Rejoindre un appel en direct sans que le client n’entende
- Guider l’agent en chuchotant des instructions
- Voir la transcription en temps réel
- Ouvrir Conversations → Moniteur en direct
- Trouver l’appel actif
- Cliquer sur Chuchoter
- Parler des instructions (l’agent entend, pas le client)
- Agent bloqué → “Transférer au service facturation”
- Agent sur le point de donner une mauvaise info → “Vérifier la base de connaissances pour les tarifs”
- Cas limite → Guider l’agent à travers un scénario inhabituel
Tests en production
Appels canari :- Faire des appels de test pendant les heures d’ouverture
- Utiliser des scénarios connus
- Comparer au comportement attendu
- Marquer comme test pour le filtrage :
metadata: {test_call: true}
- Appels de test automatisés toutes les heures
- Vérifier que les flux clés fonctionnent toujours
- Alerter si les tests commencent à échouer
Quand contacter le support
Contactez support@itellico.ai lorsque :- Problèmes de plateforme : Pannes généralisées, erreurs API affectant tous les agents
- Incidents de sécurité : Violation suspectée, modèles d’accès inhabituels
- Litiges de facturation : Frais inattendus, écarts d’utilisation
- Problèmes d’opérateur : Trunk SIP ne s’enregistrant pas, problèmes de portage de numéro
- Rapports de bugs : Bugs de plateforme clairs (pas de problèmes de configuration)
- ID d’agent et ID d’appels montrant le problème
- Messages d’erreur des journaux
- Étapes pour reproduire
- Ce que tu as déjà essayé
- Impact commercial (combien d’utilisateurs affectés)
- Critique (production en panne) : <1 heure
- Élevé (fonctionnalité majeure cassée) : <4 heures
- Moyen (solution de contournement existante) : <24 heures
- Faible (demande de fonctionnalité, question) : <48 heures