Visão Geral
Quando você atribui conhecimento ao seu agente, precisa escolher como o agente acessa essas informações. O itellicoAI oferece dois métodos de acesso: Modo Contexto (injeção de prompt) e Modo RAG (Geração Aumentada por Recuperação). Entender a diferença entre essas abordagens ajudará você a otimizar o desempenho e a precisão do seu agente.Os Dois Métodos de Acesso
Modo Contexto
Injeção de PromptTodo o conhecimento é injetado diretamente no contexto de conversa do agente no início de cada interação.Melhor para: Bases de conhecimento pequenas com informações críticas que o agente precisa para cada conversa.
Modo RAG
Geração Aumentada por RecuperaçãoO agente busca e recupera dinamicamente conhecimento relevante com base no tópico da conversa.Melhor para: Bases de conhecimento grandes onde apenas seções específicas são necessárias por conversa.
Modo Contexto (Injeção de Prompt)
Como Funciona
No Modo Contexto, o conteúdo da sua base de conhecimento é carregado diretamente no prompt do sistema do agente no início de cada conversa:Saída Formatada
Por padrão, o conhecimento é injetado com formatação estruturada:Quando Usar o Modo Contexto
Bases de conhecimento pequenas (< 1.000 palavras)
Bases de conhecimento pequenas (< 1.000 palavras)
Se sua base de conhecimento for compacta, o Modo Contexto garante que o agente sempre tenha contexto completo.Exemplo de caso de uso:
Um agente de suporte com uma base de conhecimento contendo:
- 10 FAQs comuns
- Política de devolução (500 palavras)
- Informações de contato
- Opções de envio
Informações críticas necessárias todas as vezes
Informações críticas necessárias todas as vezes
Informações que o agente deve referenciar na maioria ou em todas as chamadas.Exemplo de caso de uso:
Um agente de agendamento que precisa:
- Políticas da empresa (sempre)
- Serviços disponíveis (sempre)
- Estrutura de preços (sempre)
- Procedimentos de agendamento (sempre)
Informações altamente estruturadas
Informações altamente estruturadas
Quando itens de conhecimento se referenciam ou formam um todo coeso.Exemplo de caso de uso:
Agente de configuração de produto com:
- Dependências de opções (“Se escolherem X, ofereça Y”)
- Matriz de compatibilidade
- Pacotes de produtos
- Preços que dependem de combinações
Vantagens do Modo Contexto
Sempre Disponível
Agente tem acesso imediato a todo o conhecimento sem atraso de busca
Melhor para Conjuntos Pequenos
Eficiente quando o conhecimento cabe confortavelmente na janela de contexto
Determinístico
Agente vê exatamente o mesmo conhecimento todas as vezes
Funciona com Variáveis
Conhecimento pode incluir variáveis Jinja que resolvem no contexto
Limitações do Modo Contexto
Limitações:- Mantenha bases de conhecimento pequenas (< 1.000 palavras)
- Todo o conhecimento é enviado com cada solicitação (custo maior)
- Todo o conhecimento é processado todas as vezes (latência maior)
- Base de conhecimento inteira é incluída mesmo que apenas uma pequena parte seja relevante
Modo RAG (Geração Aumentada por Recuperação)
Como Funciona
No Modo RAG, sua base de conhecimento é armazenada em um banco de dados vetorial. Quando o agente precisa de informação:- Usuário faz uma pergunta: “Qual é a sua política de devolução?”
- Agente identifica necessidade: Agente determina que precisa de conhecimento sobre devoluções
- Sistema busca: Sistema RAG busca na base de conhecimento por conteúdo relevante
- Conteúdo relevante recuperado: Apenas a seção de política de devolução é buscada
- Agente responde: Agente usa conhecimento recuperado para responder
Recuperação Inteligente
RAG usa busca semântica com embeddings vetoriais para encontrar conhecimento relevante:Vantagens do Modo RAG
Escala Infinitamente
Suporte bases de conhecimento massivas sem limites de contexto
Mais Rápido para Conhecimento Grande
Reduz tokens de prompt do sistema para bases de conhecimento grandes
Eficiente
Recupera apenas o necessário para o tópico atual
Melhor para Diversidade
Lida bem com grande variedade de tópicos não relacionados
Considerações do Modo RAG
RAG depende da qualidade do embedding vetorial. Se seus itens de conhecimento não estiverem claramente escritos, a recuperação pode perder informações relevantes.
- Títulos de itens de conhecimento claros e descritivos
- Conteúdo bem estruturado
- Categorização adequada em pastas
- Evitar informações duplicadas ou conflitantes
Indicador de Tokens de Contexto Restantes
Ao usar o Modo Contexto, monitore seus tokens de contexto restantes para garantir que você tenha espaço suficiente para conversas.Entendendo o Indicador
O painel mostra seu uso de contexto nas configurações de Conhecimento:

- Modo RAG: Busca vetorial dinâmica com tamanho de conhecimento ilimitado
- Modo Contexto: Adicionado ao prompt do sistema com limite de 10.000 tokens
Escolhendo o Modo Certo
Use este guia de decisão para selecionar o melhor método de acesso:Abordagem Híbrida
Você pode usar ambos os modos para diferentes bases de conhecimento no mesmo agente: Exemplo de configuração:- Modo Contexto: Base de conhecimento pequena “Políticas Essenciais” (sempre necessária)
- Modo RAG: Base de conhecimento grande “Catálogo de Produtos” (recuperar conforme necessário)
Testando Sua Configuração
Atribuir base de conhecimento
Configure seu agente com uma base de conhecimento em Modo Contexto ou RAG.
Perguntar sobre conteúdo de conhecimento
Faça perguntas que devem ser respondidas da sua base de conhecimento.Exemplos de perguntas:
- “Qual é a sua política de devolução?”
- “Quanto custa o plano Pro?”
- “Qual é o seu horário comercial?”
Verificar respostas
Confirme se o agente está usando corretamente o conteúdo do conhecimento nas respostas.
Melhores Práticas
Comece com RAG para bases grandes
Comece com RAG para bases grandes
Em caso de dúvida, use Modo RAG. É mais seguro para bases de conhecimento grandes e você sempre pode mudar para Modo Contexto se necessário.
Escreva conteúdo claro e completo
Escreva conteúdo claro e completo
RAG usa busca semântica para encontrar conhecimento relevante. Escreva conteúdo completo e bem escrito que naturalmente inclua os termos e conceitos sobre os quais os usuários perguntarão.Bom: “Nossa política de devolução permite devoluções dentro de 30 dias da compra para produtos físicos. Produtos digitais não podem ser devolvidos uma vez baixados.”Ruim: “Ver doc de política” ou fragmentos de frases incompletos
Teste ambos os modos
Teste ambos os modos
Tente tanto o Modo Contexto quanto RAG com sua base de conhecimento e veja qual tem melhor desempenho para seu caso de uso.
Combine estrategicamente
Combine estrategicamente
Use Modo Contexto para informações críticas e frequentemente necessárias e Modo RAG para material de referência extenso.
Solução de Problemas
Agente não está usando conhecimento (Modo Contexto)
Agente não está usando conhecimento (Modo Contexto)
Verifique:
- Todos os itens de conhecimento estão em status COMPLETED?
- O contexto restante é suficiente (não truncado)?
- Corrija itens com falha
- Reduza tamanho do conhecimento ou mude para RAG
Agente não está encontrando conhecimento (Modo RAG)
Agente não está encontrando conhecimento (Modo RAG)
Verifique:
- O conteúdo está bem organizado?
- Você está fazendo perguntas que correspondem ao conhecimento?
- Adicione conteúdo mais detalhado
- Teste com diferentes formulações
- Considere adicionar palavras-chave ao conteúdo
Agente fornece informações erradas ou desatualizadas
Agente fornece informações erradas ou desatualizadas
Verifique:
- O conteúdo do conhecimento está correto e atual?
- Você tem informações conflitantes em vários itens?
- Atualize conteúdo do conhecimento
- Remova duplicatas e conflitos
Uso de contexto muito alto
Uso de contexto muito alto
Soluções:
- Mude para Modo RAG para bases de conhecimento grandes
- Divida conhecimento em bases menores e focadas
- Reduza comprimento das instruções do agente
- Remova conteúdo verboso ou redundante