Abordagem de diagnóstico
Quando problemas surgem na produção, use este processo sistemático de solução de problemas:- Identificar sintomas - O que está quebrado? Chamadas falhando, agente se comportando mal, integrações fora do ar?
- Verificar escopo - Afeta todas as chamadas ou subconjunto específico? Começou quando?
- Revisar logs - Procurar mensagens de erro, padrões, rastreamentos de pilha
- Isolar causa - É um problema de configuração, integração, plataforma ou operadora?
- Aplicar correção - Implantar a menor mudança que resolva o problema
- Validar - Testar minuciosamente antes de marcar como resolvido
Problemas comuns e soluções
Nenhuma chamada sendo recebida
Sintoma: Número de telefone não toca, chamadas vão para o silêncio ou “número fora de serviço”Verificar atribuição de número de telefone
Verificar atribuição de número de telefone
Diagnóstico:
- Ir para Telefonia → Números
- Encontrar seu número, verificar a coluna “Agente atribuído”
- Verificar se está atribuído ao agente correto (não “Não atribuído”)
- Clicar no número → Selecionar agente no menu suspenso → Salvar
- Aguardar 30 segundos para que a atualização de roteamento se propague
- Testar ligando para o número novamente
Verificar registro do trunk SIP
Verificar registro do trunk SIP
Diagnóstico:Procurar por
"status": "registered". Se "unregistered" ou "failed":Causas comuns:- Credenciais SIP incorretas (usuário/senha)
- IP não está na lista permitida da operadora
- Firewall bloqueando UDP 5060
- Endpoint da operadora fora do ar
- Verificar credenciais com a operadora
- Verificar o portal da operadora para configurações de lista permitida de IP
- Testar com
curl -v sip:carrier.com:5060para verificar conectividade - Contatar operadora se o endpoint dela estiver inacessível
Verificar provisionamento do número
Verificar provisionamento do número
Diagnóstico:
- Status do número mostra “Pendente” ou “Falhado”
- Número foi comprado há menos de 5 minutos
- Aguardar até 10 minutos para o provisionamento ser concluído
- Se travado >30 min, clicar em “Tentar provisionamento novamente”
- Se ainda falhar, contatar o suporte com detalhes do número
Problemas de roteamento da operadora
Problemas de roteamento da operadora
Diagnóstico:
- Chamadas funcionam quando VOCÊ liga, mas não de telefones de clientes
- Códigos de área específicos ou operadoras não conseguem te alcançar
- Verificar se a tabela de roteamento da operadora inclui sua faixa de números
- Verificar registro CNAM (Nome do chamador)
- Verificar marcação de spam (usar ferramentas gratuitas de pesquisa de operadora)
- Pode precisar contatar a operadora para corrigir o roteamento
Qualidade de chamada ruim
Sintoma: Áudio picotado, eco, voz robótica, atrasos longosProblemas de áudio (eco, ruído, cortes)
Problemas de áudio (eco, ruído, cortes)
Diagnóstico:
Configuração:
- Abrir Conversas → Logs → Selecionar chamada afetada
- Verificar métricas de “Qualidade de chamada”:
- Jitter: Deve ser <30ms
- Perda de pacotes: Deve ser <1%
- RTT (Tempo de ida e volta): Deve ser <200ms
| Sintoma | Causa provável | Correção |
|---|---|---|
| Eco | Eco acústico (feedback do alto-falante) | Ativar AEC nas configurações do agente |
| Picotado/Robótico | Perda de pacotes ou jitter | Verificar largura de banda da rede, trocar codec |
| Cortes | Firewall bloqueando RTP | Abrir portas UDP 10000-60000 |
| Áudio unidirecional | Problema de travessia NAT | Ativar relay TURN |
| Ruído de fundo | Ambiente barulhento | Ativar supressão de ruído |
Alta latência (agente responde lentamente)
Alta latência (agente responde lentamente)
Diagnóstico:
- Verificar Painel → Métricas → Tempo médio de resposta
- Meta: <500ms
- Se >1000ms, investigar:
-
Lentidão do provedor do modelo
- Verificar status.openai.com ou status.anthropic.com
- Procurar por latências elevadas ou interrupções
- Mudar para modelo de fallback se disponível
-
Janela de contexto grande
- Instruções longas ou recuperações massivas da base de conhecimento
- Solução: Reduzir comprimento das instruções, limitar chunks de KB a 3
-
Lentidão de API externa
- Verificar Análises → Ações para chamadas API lentas
- APIs demorando >2s irão atrasar a resposta do agente
- Adicionar limites de timeout e respostas de fallback
-
Problemas de rede
- Verificar de múltiplas localizações
- Se região específica for afetada, pode ser problema de roteamento ISP
- Contatar suporte para investigar
- Mudar para modelo mais rápido (GPT-4 → GPT-3.5 Turbo)
- Reduzir número de chunks de base de conhecimento recuperados
- Aumentar timeouts de API para evitar espera
Erros de transcrição (palavras erradas)
Erros de transcrição (palavras erradas)
Diagnóstico:Tentar transcritor diferente:
- Revisar transcrição em Conversas → Logs
- Procurar padrões:
- Termos técnicos mal ouvidos → Adicionar a vocabulário personalizado
- Sotaques mal compreendidos → Tentar transcritor diferente
- Ruído de fundo → Ativar supressão de ruído
- Deepgram: Melhor para sotaques, ambientes barulhentos
- Azure: Melhor para termos técnicos
- Whisper: Melhor para multilíngue
- Usar codec de bitrate mais alto (Opus 64kbps)
- Ativar supressão de ruído
- Testar com telefone/microfone diferente para chamadas web
Agente não responde corretamente
Sintoma: Agente dá respostas erradas, ignora instruções, se comporta erraticamenteAgente não segue instruções
Agente não segue instruções
Diagnóstico:2. Instruções muito longas (>500 palavras):
- Abrir configurações do agente → Conversa → Instruções
- Testar no simulador com cenário exato
- Verificar se o problema é:
- Sempre acontece → Problema de instruções
- Intermitente → Problema de contexto ou modelo
- Modelo perde foco em prompts longos
- Solução: Dividir em seções claras, usar marcadores
- Exemplo: “Seja conciso” mas também “Forneça explicações detalhadas”
- Solução: Priorizar um comportamento, remover conflito
- Executar 10 chamadas de teste cobrindo casos extremos
- Revisar transcrições para conformidade
- Iterar instruções com base em falhas
Agente alucina ou inventa fatos
Agente alucina ou inventa fatos
Diagnóstico:2. Expandir base de conhecimento:4. Usar modo de citação (se disponível):
- Agente diz coisas que não estão na base de conhecimento ou instruções
- Fornece detalhes de produto, preços ou políticas incorretos
- Base de conhecimento não abrangente o suficiente
- Instruções não enfatizam “usar apenas informação fornecida”
- Modelo muito criativo (temperatura muito alta)
- Revisar respostas “Não sei” nos logs
- Adicionar conteúdo faltante à KB
- Testar recuperação com consultas de exemplo
- Força agente a citar fontes da KB
- Torna óbvio quando informação não está na KB
Agente fica preso em loops
Agente fica preso em loops
Diagnóstico:2. Melhorar reconhecimento de intenção:
- Agente repete a mesma pergunta 3+ vezes
- Conversa gira em círculos
- Chamador fica frustrado
- Agente não reconhece que chamador respondeu
- Transcrição falhou (não ouviu a resposta)
- Instruções não lidam com caso extremo
- Adicionar exemplos de respostas de casos extremos às instruções
- Usar respostas estruturadas (DTMF para informações críticas)
- Ativar fallback “Não tenho certeza” para humano
- Chamador silencioso
- Chamador prolixo
- Chamador com sotaque forte
- Ambiente barulhento
Falhas de integração
Sintoma: Ações não disparam, chamadas API falham, transferências não funcionamAção de API falha
Ação de API falha
Diagnóstico:
Testes:Se curl manual funciona mas agente falha, verificar:
- Abrir Conversas → Logs → Selecionar chamada falhada
- Navegar para aba Ações
- Procurar mensagem de erro (ex. “Timeout de API”, “401 Não autorizado”)
| Erro | Causa | Correção |
|---|---|---|
401 Unauthorized | Chave API errada | Regenerar chave, atualizar config do agente |
403 Forbidden | Problema de permissões | Conceder ao agente acesso ao recurso |
404 Not Found | URL de endpoint errada | Verificar URL na configuração da ação |
408 Timeout | API muito lenta | Aumentar timeout (padrão 5s → 10s) |
500 Internal Server Error | API externa fora do ar | Verificar página de status da API, adicionar lógica de retry |
SSL Certificate Error | Problema HTTPS | Verificar certificado válido, não expirado |
- Lista permitida de IP (IPs do agente podem precisar estar na lista permitida)
- Limitação de taxa (agente pode atingir limites mais rápido que testes manuais)
Transferência falha
Transferência falha
Diagnóstico:
- Agente diz “Transferindo…” mas chamada cai ou nada acontece
- Verificar Logs → Ações para status de transferência
- Verificar formato do número (deve ser E.164: +1234567890)
- Verificar se número é alcançável (ligar manualmente)
- Algumas operadoras não suportam SIP REFER para transferências
- Solução: Usar “transferência assistida” em vez de “transferência cega”
- Ou ativar modo “ponte de chamada”
- Verificar com operadora se transferências estão habilitadas
- Pode precisar fazer upgrade do trunk SIP para suportar
Base de conhecimento não recupera
Base de conhecimento não recupera
Diagnóstico:Causas comuns:1. KB não vinculada ao agente:
- Agente diz “Não sei” quando resposta está na KB
- Testar recuperação manualmente:
- Verificar configurações do agente → Conhecimento → Verificar KB atribuída
- Conteúdo recém-carregado leva 2-5 minutos para indexar
- Verificar se status da KB mostra “Indexado” não “Processando”
- Cliente pergunta “Posso receber dinheiro de volta?” mas KB diz “Política de reembolso”
- Solução: Adicionar sinônimos, reescrever conteúdo da KB para corresponder a frases comuns
- Limite mínimo de similaridade muito alto (ex. 0.9)
- Solução: Reduzir para 0.7-0.8
Capacidade e desempenho
Atingindo limites de concorrência
Atingindo limites de concorrência
Sintoma: Sinal de ocupado, chamadas enfileiradas por minutos, mensagem “Todos agentes ocupados”Diagnóstico:
- Verificar Painel → Capacidade para concorrência atual/máxima
- Revisar gráfico de volume de chamadas para horários de pico
- Ativar fila: Deixar chamadores esperarem em vez de sinal de ocupado
- Adicionar agente de overflow: Rotear para agente de backup quando principal em capacidade
- Estender horário comercial: Distribuir volume por mais horas
- Oferecer retorno de chamada: “Ligaremos de volta em 10 minutos”
- Fazer upgrade do plano: Aumentar limite de chamadas concorrentes
- Balanceamento de carga: Criar múltiplos agentes, distribuir números
- Auto-escalonamento: Ativar escalonamento dinâmico de capacidade (Enterprise)
- Incentivos fora do horário de pico: Encorajar chamadas durante períodos de baixo tráfego
Alto volume de chamadas sobrecarrega sistema
Alto volume de chamadas sobrecarrega sistema
Sintoma: Chamadas demorando mais para conectar, fila crescendo, erros aumentandoDiagnóstico:
- Pico de tráfego súbito (3x+ volume normal)
- Verificar:
- Campanha de marketing lançada?
- Menção na mídia / post viral?
- Interrupção do sistema causando tempestade de tentativas?
- Limitação de taxa: Reduzir temporariamente chamadas concorrentes máximas para estabilizar
- Fila agressiva: Reter chamadas em vez de descartá-las
- Mensagem de fallback: “Volume incomumente alto. Por favor, tente novamente em 15 minutos.”
- Escalonamento de emergência: Contatar suporte para aumento temporário de capacidade
- Prever tráfego para eventos conhecidos (lançamentos de produtos, vendas)
- Pré-escalonar capacidade antes de picos esperados
- Configurar gatilhos de auto-escalonamento
Custos mais altos que o esperado
Custos mais altos que o esperado
Diagnóstico:
- Verificar Faturamento → Uso para detalhamento:
- Custos de API do modelo
- Minutos de telefonia
- Custos de armazenamento
- Recursos premium (ML-AMD, etc.)
- Chamada média >10 minutos (típico é 3-5 min)
- Causa: Agente muito verborrágico, loops, não encerra chamadas
- Correção: Adicionar metas de duração de chamada, ativar timeout
- Usar GPT-4 para chamadas FAQ simples
- Correção: Mudar para GPT-3.5 Turbo (3x mais barato)
- Não usar AMD, cobrando minutos completos por correios de voz
- Correção: Ativar AMD baseado em texto (grátis) ou ML-AMD (+R0,50+/VM)
- Usar transcritor premium para todas as chamadas
- Correção: Usar transcritor padrão a menos que precisão seja crítica
- Ativar AMD para campanhas de saída
- Definir duração máxima de chamada (ex. 15 minutos)
- Usar modelo mais barato para chamadas simples
- Comprimir gravações de áudio (bitrate mais baixo)
- Excluir automaticamente gravações antigas após 30 dias
Ferramentas e técnicas de depuração
Análise de logs
Acesso a logs:- Conversas → Logs → Usar filtros:
- Status: Falhado
- Intervalo de datas: Últimas 24 horas
- Agente: agente específico
- Tipo de erro: erro específico
Depuração ao vivo
Modo sussurro:- Entrar em chamada ao vivo sem o cliente ouvir
- Guiar agente sussurrando instruções
- Ver transcrição em tempo real
- Abrir Conversas → Monitor ao vivo
- Encontrar chamada ativa
- Clicar em Sussurrar
- Falar instruções (agente ouve, cliente não)
- Agente preso → “Transferir para departamento de faturamento”
- Agente prestes a dar informação errada → “Verificar base de conhecimento para preços”
- Caso extremo → Guiar agente através de cenário incomum
Testes em produção
Chamadas canário:- Fazer chamadas de teste durante horário comercial
- Usar cenários conhecidos
- Comparar com comportamento esperado
- Marcar como teste para filtragem:
metadata: {test_call: true}
- Chamadas de teste automatizadas a cada hora
- Verificar se fluxos principais ainda funcionam
- Alertar se testes começarem a falhar
Quando contatar o suporte
Contate support@itellico.ai quando:- Problemas de plataforma: Interrupções generalizadas, erros de API afetando todos os agentes
- Incidentes de segurança: Violação suspeita, padrões de acesso incomuns
- Disputas de faturamento: Cobranças inesperadas, discrepâncias de uso
- Problemas de operadora: Trunk SIP não registrando, problemas de portabilidade de número
- Relatórios de bugs: Bugs claros da plataforma (não problemas de configuração)
- ID do agente e IDs de chamadas mostrando o problema
- Mensagens de erro dos logs
- Passos para reproduzir
- O que você já tentou
- Impacto nos negócios (quantos usuários afetados)
- Crítico (produção fora do ar): <1 hora
- Alto (recurso principal quebrado): <4 horas
- Médio (existe solução alternativa): <24 horas
- Baixo (solicitação de recurso, pergunta): <48 horas