Enfoque de diagnóstico
Cuando surgen problemas en producción, utilice este proceso sistemático de solución de problemas:- Identificar síntomas - ¿Qué está roto? ¿Llamadas fallando, agente comportándose mal, integraciones caídas?
- Verificar alcance - ¿Afecta todas las llamadas o un subconjunto específico? ¿Desde cuándo?
- Revisar registros - Buscar mensajes de error, patrones, trazas de pila
- Aislar causa - ¿Es un problema de configuración, integración, plataforma u operador?
- Aplicar solución - Implementar el cambio más pequeño que resuelva el problema
- Validar - Probar exhaustivamente antes de marcar como resuelto
Problemas comunes y soluciones
No se reciben llamadas
Síntoma: El número de teléfono no suena, las llamadas van al silencio o “número fuera de servicio”Verificar asignación de número de teléfono
Verificar asignación de número de teléfono
Diagnóstico:
- Ir a Telefonía → Números
- Encontrar su número, verificar la columna “Agente asignado”
- Verificar que esté asignado al agente correcto (no “Sin asignar”)
- Hacer clic en el número → Seleccionar agente del menú desplegable → Guardar
- Esperar 30 segundos para que se propague la actualización de enrutamiento
- Probar llamando al número nuevamente
Verificar registro del trunk SIP
Verificar registro del trunk SIP
Diagnóstico:Buscar
"status": "registered". Si "unregistered" o "failed":Causas comunes:- Credenciales SIP incorrectas (usuario/contraseña)
- IP no en lista blanca del operador
- Firewall bloqueando UDP 5060
- Punto final del operador caído
- Verificar credenciales con el operador
- Verificar el portal del operador para configuración de lista blanca de IP
- Probar con
curl -v sip:carrier.com:5060para verificar conectividad - Contactar al operador si su punto final es inaccesible
Verificar aprovisionamiento del número
Verificar aprovisionamiento del número
Diagnóstico:
- El estado del número muestra “Pendiente” o “Fallido”
- El número fue comprado hace menos de 5 minutos
- Esperar hasta 10 minutos para que se complete el aprovisionamiento
- Si está atascado >30 min, hacer clic en “Reintentar aprovisionamiento”
- Si sigue fallando, contactar al soporte con detalles del número
Problemas de enrutamiento del operador
Problemas de enrutamiento del operador
Diagnóstico:
- Las llamadas funcionan cuando USTED llama, pero no desde teléfonos de clientes
- Códigos de área específicos u operadores no pueden comunicarse
- Verificar que la tabla de enrutamiento del operador incluya su rango de números
- Verificar el registro CNAM (Nombre de llamante)
- Verificar marcado de spam (usar herramientas gratuitas de búsqueda de operador)
- Puede necesitar contactar al operador para corregir el enrutamiento
Mala calidad de llamada
Síntoma: Audio entrecortado, eco, voz robótica, retrasos largosProblemas de audio (eco, ruido, cortes)
Problemas de audio (eco, ruido, cortes)
Diagnóstico:
Configuración:
- Abrir Conversaciones → Registros → Seleccionar llamada afectada
- Verificar métricas de “Calidad de llamada”:
- Jitter: Debe ser <30ms
- Pérdida de paquetes: Debe ser <1%
- RTT (tiempo de ida y vuelta): Debe ser <200ms
| Síntoma | Causa probable | Solución |
|---|---|---|
| Eco | Eco acústico (retroalimentación del altavoz) | Habilitar AEC en configuración del agente |
| Entrecortado/Robótico | Pérdida de paquetes o jitter | Verificar ancho de banda de red, cambiar codec |
| Cortes | Firewall bloqueando RTP | Abrir puertos UDP 10000-60000 |
| Audio unidireccional | Problema de traversal NAT | Habilitar relé TURN |
| Ruido de fondo | Entorno ruidoso | Habilitar supresión de ruido |
Alta latencia (el agente responde lentamente)
Alta latencia (el agente responde lentamente)
Diagnóstico:
- Verificar Panel → Métricas → Tiempo de respuesta promedio
- Objetivo: <500ms
- Si >1000ms, investigar:
-
Ralentización del proveedor del modelo
- Verificar status.openai.com o status.anthropic.com
- Buscar latencias elevadas o interrupciones
- Cambiar a modelo de respaldo si está disponible
-
Ventana de contexto grande
- Instrucciones largas o recuperaciones masivas de base de conocimientos
- Solución: Reducir longitud de instrucciones, limitar chunks de KB a 3
-
Lentitud de API externa
- Verificar Analítica → Acciones para llamadas API lentas
- APIs que tardan >2s retrasarán la respuesta del agente
- Agregar límites de tiempo de espera y respuestas de respaldo
-
Problemas de red
- Verificar desde múltiples ubicaciones
- Si una región específica está afectada, puede ser un problema de enrutamiento del ISP
- Contactar al soporte para investigar
- Cambiar a modelo más rápido (GPT-4 → GPT-3.5 Turbo)
- Reducir el número de chunks de base de conocimientos recuperados
- Aumentar tiempos de espera de API para evitar esperas
Errores de transcripción (palabras incorrectas)
Errores de transcripción (palabras incorrectas)
Diagnóstico:Probar diferente transcriptor:
- Revisar transcripción en Conversaciones → Registros
- Buscar patrones:
- Términos técnicos mal escuchados → Agregar a vocabulario personalizado
- Acentos mal entendidos → Probar diferente transcriptor
- Ruido de fondo → Habilitar supresión de ruido
- Deepgram: Mejor para acentos, entornos ruidosos
- Azure: Mejor para términos técnicos
- Whisper: Mejor para multilingüe
- Usar codec de mayor tasa de bits (Opus 64kbps)
- Habilitar supresión de ruido
- Probar con teléfono/micrófono diferente para llamadas web
El agente no responde correctamente
Síntoma: El agente da respuestas incorrectas, ignora instrucciones, se comporta erráticamenteEl agente no sigue las instrucciones
El agente no sigue las instrucciones
Diagnóstico:2. Instrucciones demasiado largas (>500 palabras):
- Abrir configuración del agente → Conversación → Instrucciones
- Probar en simulador con escenario exacto
- Verificar si el problema es:
- Siempre ocurre → Problema de instrucciones
- Intermitente → Problema de contexto o modelo
- El modelo pierde el foco en prompts largos
- Solución: Dividir en secciones claras, usar viñetas
- Ejemplo: “Sea conciso” pero también “Proporcione explicaciones detalladas”
- Solución: Priorizar un comportamiento, eliminar conflicto
- Ejecutar 10 llamadas de prueba cubriendo casos límite
- Revisar transcripciones para cumplimiento
- Iterar instrucciones basándose en fallos
El agente alucina o inventa hechos
El agente alucina o inventa hechos
Diagnóstico:2. Expandir base de conocimientos:4. Usar modo de cita (si está disponible):
- El agente dice cosas que no están en la base de conocimientos o instrucciones
- Proporciona detalles de producto, precios o políticas incorrectos
- Base de conocimientos no lo suficientemente completa
- Las instrucciones no enfatizan “usar solo información proporcionada”
- Modelo demasiado creativo (temperatura demasiado alta)
- Revisar respuestas “No lo sé” en registros
- Agregar contenido faltante a KB
- Probar recuperación con consultas de ejemplo
- Obliga al agente a citar fuentes de KB
- Hace obvio cuando la información no está en KB
El agente se queda atascado en bucles
El agente se queda atascado en bucles
Diagnóstico:2. Mejorar reconocimiento de intención:
- El agente repite la misma pregunta 3+ veces
- La conversación da vueltas en círculos
- El llamante se frustra
- El agente no reconoce que el llamante respondió
- La transcripción falló (no escuchó la respuesta)
- Las instrucciones no manejan el caso límite
- Agregar ejemplos de respuestas de casos límite a instrucciones
- Usar respuestas estructuradas (DTMF para información crítica)
- Habilitar respaldo “No estoy seguro” a humano
- Llamante silencioso
- Llamante divagador
- Llamante con acento marcado
- Entorno ruidoso
Fallos de integración
Síntoma: Las acciones no se activan, las llamadas API fallan, las transferencias no funcionanLa acción API falla
La acción API falla
Diagnóstico:
Pruebas:Si curl manual funciona pero el agente falla, verificar:
- Abrir Conversaciones → Registros → Seleccionar llamada fallida
- Navegar a la pestaña Acciones
- Buscar mensaje de error (ej. “Tiempo de espera de API”, “401 No autorizado”)
| Error | Causa | Solución |
|---|---|---|
401 Unauthorized | Clave API incorrecta | Regenerar clave, actualizar configuración del agente |
403 Forbidden | Problema de permisos | Otorgar al agente acceso al recurso |
404 Not Found | URL de punto final incorrecta | Verificar URL en configuración de acción |
408 Timeout | API demasiado lenta | Aumentar tiempo de espera (predeterminado 5s → 10s) |
500 Internal Server Error | API externa caída | Verificar página de estado de API, agregar lógica de reintento |
SSL Certificate Error | Problema HTTPS | Verificar certificado válido, no expirado |
- Lista blanca de IP (las IP del agente pueden necesitar estar en lista blanca)
- Limitación de tasa (el agente puede alcanzar límites más rápido que pruebas manuales)
La transferencia falla
La transferencia falla
Diagnóstico:
- El agente dice “Transfiriendo…” pero la llamada se cae o no pasa nada
- Verificar Registros → Acciones para estado de transferencia
- Verificar formato del número (debe ser E.164: +1234567890)
- Verificar que el número sea alcanzable (llamarlo manualmente)
- Algunos operadores no admiten SIP REFER para transferencias
- Solución: Usar “transferencia asistida” en lugar de “transferencia ciega”
- O habilitar modo “puente de llamada”
- Verificar con el operador si las transferencias están habilitadas
- Puede necesitar actualizar el trunk SIP para admitirlas
La base de conocimientos no recupera
La base de conocimientos no recupera
Diagnóstico:Causas comunes:1. KB no vinculada al agente:
- El agente dice “No lo sé” cuando la respuesta está en KB
- Probar recuperación manualmente:
- Verificar configuración del agente → Conocimiento → Verificar KB asignada
- El contenido recién cargado tarda 2-5 minutos en indexarse
- Verificar que el estado de KB muestre “Indexado” no “Procesando”
- El cliente pregunta “¿Puedo recuperar dinero?” pero KB dice “Política de reembolso”
- Solución: Agregar sinónimos, reescribir contenido de KB para coincidir con frases comunes
- Umbral mínimo de similitud demasiado alto (ej. 0.9)
- Solución: Reducir a 0.7-0.8
Capacidad y rendimiento
Alcanzando límites de concurrencia
Alcanzando límites de concurrencia
Síntoma: Señal de ocupado, llamadas en cola durante minutos, mensaje “Todos los agentes ocupados”Diagnóstico:
- Verificar Panel → Capacidad para concurrencia actual/máxima
- Revisar gráfico de volumen de llamadas para horas pico
- Habilitar cola: Dejar que los llamantes esperen en lugar de señal de ocupado
- Agregar agente de desbordamiento: Enrutar a agente de respaldo cuando el principal está a capacidad
- Extender horario comercial: Distribuir volumen en más horas
- Ofrecer devolución de llamada: “Le devolveremos la llamada en 10 minutos”
- Actualizar plan: Aumentar límite de llamadas concurrentes
- Equilibrio de carga: Crear múltiples agentes, distribuir números
- Auto-escalado: Habilitar escalado dinámico de capacidad (Empresa)
- Incentivos fuera de horas pico: Fomentar llamadas durante tiempos de bajo tráfico
Alto volumen de llamadas abruma el sistema
Alto volumen de llamadas abruma el sistema
Síntoma: Las llamadas tardan más en conectarse, la cola se acumula, los errores aumentanDiagnóstico:
- Pico de tráfico repentino (3x+ volumen normal)
- Verificar:
- ¿Campaña de marketing lanzada?
- ¿Mención en medios / publicación viral?
- ¿Interrupción del sistema causando tormenta de reintentos?
- Limitación de tasa: Reducir temporalmente llamadas concurrentes máximas para estabilizar
- Cola agresiva: Retener llamadas en lugar de descartarlas
- Mensaje de respaldo: “Volumen inusualmente alto. Por favor intente de nuevo en 15 minutos.”
- Escalado de emergencia: Contactar al soporte para aumento temporal de capacidad
- Pronosticar tráfico para eventos conocidos (lanzamientos de productos, ventas)
- Pre-escalar capacidad antes de picos esperados
- Configurar disparadores de auto-escalado
Costos más altos de lo esperado
Costos más altos de lo esperado
Diagnóstico:
- Verificar Facturación → Uso para desglose:
- Costos de API del modelo
- Minutos de telefonía
- Costos de almacenamiento
- Características premium (ML-AMD, etc.)
- Llamada promedio >10 minutos (típico es 3-5 min)
- Causa: Agente demasiado verboso, bucles, no finaliza llamadas
- Solución: Agregar objetivos de duración de llamada, habilitar tiempo de espera
- Usar GPT-4 para llamadas FAQ simples
- Solución: Cambiar a GPT-3.5 Turbo (3x más barato)
- No usar AMD, cobrando minutos completos por buzones de voz
- Solución: Habilitar AMD basado en texto (gratis) o ML-AMD (+0.50+/VM)
- Usar transcriptor premium para todas las llamadas
- Solución: Usar transcriptor estándar a menos que la precisión sea crítica
- Habilitar AMD para campañas salientes
- Establecer duración máxima de llamada (ej. 15 minutos)
- Usar modelo más barato para llamadas simples
- Comprimir grabaciones de audio (tasa de bits más baja)
- Eliminar automáticamente grabaciones antiguas después de 30 días
Herramientas y técnicas de depuración
Análisis de registros
Acceso a registros:- Conversaciones → Registros → Usar filtros:
- Estado: Fallido
- Rango de fechas: Últimas 24 horas
- Agente: agente específico
- Tipo de error: error específico
Depuración en vivo
Modo susurro:- Unirse a llamada en vivo sin que el cliente escuche
- Guiar al agente susurrando instrucciones
- Ver transcripción en tiempo real
- Abrir Conversaciones → Monitor en vivo
- Encontrar llamada activa
- Hacer clic en Susurrar
- Hablar instrucciones (el agente escucha, el cliente no)
- Agente atascado → “Transferir a departamento de facturación”
- Agente a punto de dar información incorrecta → “Verificar base de conocimientos para precios”
- Caso límite → Guiar al agente a través de escenario inusual
Pruebas en producción
Llamadas canario:- Hacer llamadas de prueba durante horario comercial
- Usar escenarios conocidos
- Comparar con comportamiento esperado
- Etiquetar como prueba para filtrado:
metadata: {test_call: true}
- Llamadas de prueba automatizadas cada hora
- Verificar que los flujos clave sigan funcionando
- Alertar si las pruebas comienzan a fallar
Cuándo contactar al soporte
Contacte a support@itellico.ai cuando:- Problemas de plataforma: Interrupciones generalizadas, errores de API que afectan a todos los agentes
- Incidentes de seguridad: Violación sospechada, patrones de acceso inusuales
- Disputas de facturación: Cargos inesperados, discrepancias de uso
- Problemas de operador: Trunk SIP no se registra, problemas de portabilidad de números
- Informes de errores: Errores claros de plataforma (no problemas de configuración)
- ID de agente e ID de llamadas que muestran el problema
- Mensajes de error de registros
- Pasos para reproducir
- Lo que ya intentó
- Impacto comercial (cuántos usuarios afectados)
- Crítico (producción caída): <1 hora
- Alto (característica principal rota): <4 horas
- Medio (existe solución alternativa): <24 horas
- Bajo (solicitud de característica, pregunta): <48 horas