Saltar para o conteúdo principal

Visão Geral

Quando você atribui conhecimento ao seu agente, precisa escolher como o agente acessa essas informações. O itellicoAI oferece dois métodos de acesso: Modo Contexto (injeção de prompt) e Modo RAG (Geração Aumentada por Recuperação). Entender a diferença entre essas abordagens ajudará você a otimizar o desempenho e a precisão do seu agente.

Os Dois Métodos de Acesso

Modo Contexto

Injeção de PromptTodo o conhecimento é injetado diretamente no contexto de conversa do agente no início de cada interação.Melhor para: Bases de conhecimento pequenas com informações críticas que o agente precisa para cada conversa.

Modo RAG

Geração Aumentada por RecuperaçãoO agente busca e recupera dinamicamente conhecimento relevante com base no tópico da conversa.Melhor para: Bases de conhecimento grandes onde apenas seções específicas são necessárias por conversa.

Modo Contexto (Injeção de Prompt)

Como Funciona

No Modo Contexto, o conteúdo da sua base de conhecimento é carregado diretamente no prompt do sistema do agente no início de cada conversa:
Prompt do Sistema:
Você é um agente de atendimento ao cliente prestativo.

[Suas instruções do agente...]

==== BASE DE CONHECIMENTO: FAQ de Suporte ao Cliente ====

### Faturamento e Pagamentos
- Pergunta: Como atualizar meu método de pagamento?
  Resposta: Você pode atualizar seu método de pagamento...

- Pergunta: Quando serei cobrado?
  Resposta: O faturamento ocorre no mesmo dia de cada mês...

### Política de Devolução
[Conteúdo completo da política de devolução]

### Informações de Envio
[Informações completas de envio]

==== FIM DA BASE DE CONHECIMENTO ====

Agora ajude o cliente com sua pergunta.
O agente vê TODO o conteúdo de conhecimento desde o início e pode referenciá-lo ao longo da conversa.

Saída Formatada

Por padrão, o conhecimento é injetado com formatação estruturada:
========================================
# Nome da Base de Conhecimento
Descrição da base de conhecimento

## Nome da Pasta
Descrição da pasta

### Título do Item
----------------------------------------
Conteúdo do item aqui
----------------------------------------
========================================
Esta formatação ajuda o agente a entender a estrutura e organização do conhecimento.

Quando Usar o Modo Contexto

Se sua base de conhecimento for compacta, o Modo Contexto garante que o agente sempre tenha contexto completo.Exemplo de caso de uso: Um agente de suporte com uma base de conhecimento contendo:
  • 10 FAQs comuns
  • Política de devolução (500 palavras)
  • Informações de contato
  • Opções de envio
Total: ~3.000 palavras - cabe facilmente no contexto.
Informações que o agente deve referenciar na maioria ou em todas as chamadas.Exemplo de caso de uso: Um agente de agendamento que precisa:
  • Políticas da empresa (sempre)
  • Serviços disponíveis (sempre)
  • Estrutura de preços (sempre)
  • Procedimentos de agendamento (sempre)
Quando itens de conhecimento se referenciam ou formam um todo coeso.Exemplo de caso de uso: Agente de configuração de produto com:
  • Dependências de opções (“Se escolherem X, ofereça Y”)
  • Matriz de compatibilidade
  • Pacotes de produtos
  • Preços que dependem de combinações

Vantagens do Modo Contexto

Sempre Disponível

Agente tem acesso imediato a todo o conhecimento sem atraso de busca

Melhor para Conjuntos Pequenos

Eficiente quando o conhecimento cabe confortavelmente na janela de contexto

Determinístico

Agente vê exatamente o mesmo conhecimento todas as vezes

Funciona com Variáveis

Conhecimento pode incluir variáveis Jinja que resolvem no contexto

Limitações do Modo Contexto

O Modo Contexto é limitado a 10.000 tokens no total em todo o conhecimento atribuído.
Limitações:
  • Mantenha bases de conhecimento pequenas (< 1.000 palavras)
  • Todo o conhecimento é enviado com cada solicitação (custo maior)
  • Todo o conhecimento é processado todas as vezes (latência maior)
  • Base de conhecimento inteira é incluída mesmo que apenas uma pequena parte seja relevante

Modo RAG (Geração Aumentada por Recuperação)

Como Funciona

No Modo RAG, sua base de conhecimento é armazenada em um banco de dados vetorial. Quando o agente precisa de informação:
  1. Usuário faz uma pergunta: “Qual é a sua política de devolução?”
  2. Agente identifica necessidade: Agente determina que precisa de conhecimento sobre devoluções
  3. Sistema busca: Sistema RAG busca na base de conhecimento por conteúdo relevante
  4. Conteúdo relevante recuperado: Apenas a seção de política de devolução é buscada
  5. Agente responde: Agente usa conhecimento recuperado para responder
O agente vê apenas o conhecimento que precisa, quando precisa.

Recuperação Inteligente

RAG usa busca semântica com embeddings vetoriais para encontrar conhecimento relevante:
Usuário: "Preciso devolver os sapatos que comprei semana passada"

Sistema RAG pensa:
- Palavras-chave: "devolver", "sapatos", "comprei"
- Significado semântico: Devoluções, possivelmente troca
- Buscar conhecimento por: política de devolução, envio, trocas

Conhecimento recuperado:
- Visão Geral da Política de Devolução
- Instruções de Envio de Devolução
- Procedimentos de Troca

NÃO recuperado:
- FAQ de Faturamento
- Especificações de Produto
- Gerenciamento de Conta

Vantagens do Modo RAG

Escala Infinitamente

Suporte bases de conhecimento massivas sem limites de contexto

Mais Rápido para Conhecimento Grande

Reduz tokens de prompt do sistema para bases de conhecimento grandes

Eficiente

Recupera apenas o necessário para o tópico atual

Melhor para Diversidade

Lida bem com grande variedade de tópicos não relacionados

Considerações do Modo RAG

RAG depende da qualidade do embedding vetorial. Se seus itens de conhecimento não estiverem claramente escritos, a recuperação pode perder informações relevantes.
Qualidade de recuperação depende de:
  • Títulos de itens de conhecimento claros e descritivos
  • Conteúdo bem estruturado
  • Categorização adequada em pastas
  • Evitar informações duplicadas ou conflitantes

Indicador de Tokens de Contexto Restantes

Ao usar o Modo Contexto, monitore seus tokens de contexto restantes para garantir que você tenha espaço suficiente para conversas.

Entendendo o Indicador

O painel mostra seu uso de contexto nas configurações de Conhecimento:
Configurações de conhecimento mostrando uso de contexto
Configurações de conhecimento mostrando uso de contexto
Você pode ver:
  • Modo RAG: Busca vetorial dinâmica com tamanho de conhecimento ilimitado
  • Modo Contexto: Adicionado ao prompt do sistema com limite de 10.000 tokens

Escolhendo o Modo Certo

Use este guia de decisão para selecionar o melhor método de acesso:

Abordagem Híbrida

Você pode usar ambos os modos para diferentes bases de conhecimento no mesmo agente: Exemplo de configuração:
  • Modo Contexto: Base de conhecimento pequena “Políticas Essenciais” (sempre necessária)
  • Modo RAG: Base de conhecimento grande “Catálogo de Produtos” (recuperar conforme necessário)
Isso lhe dá o melhor dos dois mundos.

Testando Sua Configuração

1

Atribuir base de conhecimento

Configure seu agente com uma base de conhecimento em Modo Contexto ou RAG.
2

Iniciar chamada de teste

Use o recurso de Chamada de Teste no painel.
3

Perguntar sobre conteúdo de conhecimento

Faça perguntas que devem ser respondidas da sua base de conhecimento.Exemplos de perguntas:
  • “Qual é a sua política de devolução?”
  • “Quanto custa o plano Pro?”
  • “Qual é o seu horário comercial?”
4

Verificar respostas

Confirme se o agente está usando corretamente o conteúdo do conhecimento nas respostas.
5

Testar casos extremos

Pergunte sobre tópicos NÃO na sua base de conhecimento para garantir que o agente responda apropriadamente (“Não tenho essa informação”).

Melhores Práticas

Em caso de dúvida, use Modo RAG. É mais seguro para bases de conhecimento grandes e você sempre pode mudar para Modo Contexto se necessário.
RAG usa busca semântica para encontrar conhecimento relevante. Escreva conteúdo completo e bem escrito que naturalmente inclua os termos e conceitos sobre os quais os usuários perguntarão.Bom: “Nossa política de devolução permite devoluções dentro de 30 dias da compra para produtos físicos. Produtos digitais não podem ser devolvidos uma vez baixados.”Ruim: “Ver doc de política” ou fragmentos de frases incompletos
Tente tanto o Modo Contexto quanto RAG com sua base de conhecimento e veja qual tem melhor desempenho para seu caso de uso.
Use Modo Contexto para informações críticas e frequentemente necessárias e Modo RAG para material de referência extenso.

Solução de Problemas

Verifique:
  • Todos os itens de conhecimento estão em status COMPLETED?
  • O contexto restante é suficiente (não truncado)?
Solução:
  • Corrija itens com falha
  • Reduza tamanho do conhecimento ou mude para RAG
Verifique:
  • O conteúdo está bem organizado?
  • Você está fazendo perguntas que correspondem ao conhecimento?
Solução:
  • Adicione conteúdo mais detalhado
  • Teste com diferentes formulações
  • Considere adicionar palavras-chave ao conteúdo
Verifique:
  • O conteúdo do conhecimento está correto e atual?
  • Você tem informações conflitantes em vários itens?
Solução:
  • Atualize conteúdo do conhecimento
  • Remova duplicatas e conflitos
Soluções:
  • Mude para Modo RAG para bases de conhecimento grandes
  • Divida conhecimento em bases menores e focadas
  • Reduza comprimento das instruções do agente
  • Remova conteúdo verboso ou redundante

Próximos Passos