itellicoAI Documentation

Visão Geral

Quando você atribui conhecimento ao seu agente, precisa escolher como o agente acessa essas informações. O itellicoAI oferece dois métodos de acesso: Modo Contexto (injeção de prompt) e Modo RAG (Geração Aumentada por Recuperação). Entender a diferença entre essas abordagens ajudará você a otimizar o desempenho e a precisão do seu agente.

Os Dois Métodos de Acesso

Modo Contexto

Injeção de PromptTodo o conhecimento é injetado diretamente no contexto de conversa do agente no início de cada interação.Melhor para: Bases de conhecimento pequenas com informações críticas que o agente precisa para cada conversa.

Modo RAG

Geração Aumentada por RecuperaçãoO agente busca e recupera dinamicamente conhecimento relevante com base no tópico da conversa.Melhor para: Bases de conhecimento grandes onde apenas seções específicas são necessárias por conversa.

Modo Contexto (Injeção de Prompt)

Como Funciona

No Modo Contexto, o conteúdo da sua base de conhecimento é carregado diretamente no prompt do sistema do agente no início de cada conversa:

Prompt do Sistema:
Você é um agente de atendimento ao cliente prestativo.

[Suas instruções do agente...]

==== BASE DE CONHECIMENTO: FAQ de Suporte ao Cliente ====

### Faturamento e Pagamentos
- Pergunta: Como atualizar meu método de pagamento?
  Resposta: Você pode atualizar seu método de pagamento...

- Pergunta: Quando serei cobrado?
  Resposta: O faturamento ocorre no mesmo dia de cada mês...

### Política de Devolução
[Conteúdo completo da política de devolução]

### Informações de Envio
[Informações completas de envio]

==== FIM DA BASE DE CONHECIMENTO ====

Agora ajude o cliente com sua pergunta.

O agente vê TODO o conteúdo de conhecimento desde o início e pode referenciá-lo ao longo da conversa.

Saída Formatada

Por padrão, o conhecimento é injetado com formatação estruturada:

========================================
# Nome da Base de Conhecimento
Descrição da base de conhecimento

## Nome da Pasta
Descrição da pasta

### Título do Item
----------------------------------------
Conteúdo do item aqui
----------------------------------------
========================================

Esta formatação ajuda o agente a entender a estrutura e organização do conhecimento.

Quando Usar o Modo Contexto

Bases de conhecimento pequenas (< 1.000 palavras)

Se sua base de conhecimento for compacta, o Modo Contexto garante que o agente sempre tenha contexto completo.Exemplo de caso de uso: Um agente de suporte com uma base de conhecimento contendo:

10 FAQs comuns
Política de devolução (500 palavras)
Informações de contato
Opções de envio

Total: ~3.000 palavras - cabe facilmente no contexto.

Informações críticas necessárias todas as vezes

Informações que o agente deve referenciar na maioria ou em todas as chamadas.Exemplo de caso de uso: Um agente de agendamento que precisa:

Políticas da empresa (sempre)
Serviços disponíveis (sempre)
Estrutura de preços (sempre)
Procedimentos de agendamento (sempre)

Informações altamente estruturadas

Quando itens de conhecimento se referenciam ou formam um todo coeso.Exemplo de caso de uso: Agente de configuração de produto com:

Dependências de opções (“Se escolherem X, ofereça Y”)
Matriz de compatibilidade
Pacotes de produtos
Preços que dependem de combinações

Vantagens do Modo Contexto

Sempre Disponível

Agente tem acesso imediato a todo o conhecimento sem atraso de busca

Melhor para Conjuntos Pequenos

Eficiente quando o conhecimento cabe confortavelmente na janela de contexto

Determinístico

Agente vê exatamente o mesmo conhecimento todas as vezes

Funciona com Variáveis

Conhecimento pode incluir variáveis Jinja que resolvem no contexto

Limitações do Modo Contexto

O Modo Contexto é limitado a 10.000 tokens no total em todo o conhecimento atribuído.

Limitações:

Mantenha bases de conhecimento pequenas (< 1.000 palavras)
Todo o conhecimento é enviado com cada solicitação (custo maior)
Todo o conhecimento é processado todas as vezes (latência maior)
Base de conhecimento inteira é incluída mesmo que apenas uma pequena parte seja relevante

Modo RAG (Geração Aumentada por Recuperação)

Como Funciona

No Modo RAG, sua base de conhecimento é armazenada em um banco de dados vetorial. Quando o agente precisa de informação:

Usuário faz uma pergunta: “Qual é a sua política de devolução?”
Agente identifica necessidade: Agente determina que precisa de conhecimento sobre devoluções
Sistema busca: Sistema RAG busca na base de conhecimento por conteúdo relevante
Conteúdo relevante recuperado: Apenas a seção de política de devolução é buscada
Agente responde: Agente usa conhecimento recuperado para responder

O agente vê apenas o conhecimento que precisa, quando precisa.

Recuperação Inteligente

RAG usa busca semântica com embeddings vetoriais para encontrar conhecimento relevante:

Usuário: "Preciso devolver os sapatos que comprei semana passada"

Sistema RAG pensa:
- Palavras-chave: "devolver", "sapatos", "comprei"
- Significado semântico: Devoluções, possivelmente troca
- Buscar conhecimento por: política de devolução, envio, trocas

Conhecimento recuperado:
- Visão Geral da Política de Devolução
- Instruções de Envio de Devolução
- Procedimentos de Troca

NÃO recuperado:
- FAQ de Faturamento
- Especificações de Produto
- Gerenciamento de Conta

Vantagens do Modo RAG

Escala Infinitamente

Suporte bases de conhecimento massivas sem limites de contexto

Mais Rápido para Conhecimento Grande

Reduz tokens de prompt do sistema para bases de conhecimento grandes

Eficiente

Recupera apenas o necessário para o tópico atual

Melhor para Diversidade

Lida bem com grande variedade de tópicos não relacionados

Considerações do Modo RAG

RAG depende da qualidade do embedding vetorial. Se seus itens de conhecimento não estiverem claramente escritos, a recuperação pode perder informações relevantes.

Qualidade de recuperação depende de:

Títulos de itens de conhecimento claros e descritivos
Conteúdo bem estruturado
Categorização adequada em pastas
Evitar informações duplicadas ou conflitantes

Indicador de Tokens de Contexto Restantes

Ao usar o Modo Contexto, monitore seus tokens de contexto restantes para garantir que você tenha espaço suficiente para conversas.

Entendendo o Indicador

O painel mostra seu uso de contexto nas configurações de Conhecimento:

Configurações de conhecimento mostrando uso de contexto

Você pode ver:

Modo RAG: Busca vetorial dinâmica com tamanho de conhecimento ilimitado
Modo Contexto: Adicionado ao prompt do sistema com limite de 10.000 tokens

Escolhendo o Modo Certo

Use este guia de decisão para selecionar o melhor método de acesso:

Abordagem Híbrida

Você pode usar ambos os modos para diferentes bases de conhecimento no mesmo agente: Exemplo de configuração:

Modo Contexto: Base de conhecimento pequena “Políticas Essenciais” (sempre necessária)
Modo RAG: Base de conhecimento grande “Catálogo de Produtos” (recuperar conforme necessário)

Isso lhe dá o melhor dos dois mundos.

Testando Sua Configuração

Atribuir base de conhecimento

Configure seu agente com uma base de conhecimento em Modo Contexto ou RAG.

Iniciar chamada de teste

Use o recurso de Chamada de Teste no painel.

Perguntar sobre conteúdo de conhecimento

Faça perguntas que devem ser respondidas da sua base de conhecimento.Exemplos de perguntas:

“Qual é a sua política de devolução?”
“Quanto custa o plano Pro?”
“Qual é o seu horário comercial?”

Verificar respostas

Confirme se o agente está usando corretamente o conteúdo do conhecimento nas respostas.

Testar casos extremos

Pergunte sobre tópicos NÃO na sua base de conhecimento para garantir que o agente responda apropriadamente (“Não tenho essa informação”).

Melhores Práticas

Comece com RAG para bases grandes

Em caso de dúvida, use Modo RAG. É mais seguro para bases de conhecimento grandes e você sempre pode mudar para Modo Contexto se necessário.

Escreva conteúdo claro e completo

RAG usa busca semântica para encontrar conhecimento relevante. Escreva conteúdo completo e bem escrito que naturalmente inclua os termos e conceitos sobre os quais os usuários perguntarão.Bom: “Nossa política de devolução permite devoluções dentro de 30 dias da compra para produtos físicos. Produtos digitais não podem ser devolvidos uma vez baixados.”Ruim: “Ver doc de política” ou fragmentos de frases incompletos

Teste ambos os modos

Tente tanto o Modo Contexto quanto RAG com sua base de conhecimento e veja qual tem melhor desempenho para seu caso de uso.

Combine estrategicamente

Use Modo Contexto para informações críticas e frequentemente necessárias e Modo RAG para material de referência extenso.

Solução de Problemas

Agente não está usando conhecimento (Modo Contexto)

Verifique:

Todos os itens de conhecimento estão em status COMPLETED?
O contexto restante é suficiente (não truncado)?

Solução:

Corrija itens com falha
Reduza tamanho do conhecimento ou mude para RAG

Agente não está encontrando conhecimento (Modo RAG)

Verifique:

O conteúdo está bem organizado?
Você está fazendo perguntas que correspondem ao conhecimento?

Solução:

Adicione conteúdo mais detalhado
Teste com diferentes formulações
Considere adicionar palavras-chave ao conteúdo

Agente fornece informações erradas ou desatualizadas

Verifique:

O conteúdo do conhecimento está correto e atual?
Você tem informações conflitantes em vários itens?

Solução:

Atualize conteúdo do conhecimento
Remova duplicatas e conflitos

Uso de contexto muito alto

Soluções:

Mude para Modo RAG para bases de conhecimento grandes
Divida conhecimento em bases menores e focadas
Reduza comprimento das instruções do agente
Remova conteúdo verboso ou redundante

Próximos Passos

Criar Bases de Conhecimento

Construa e organize seu conteúdo de conhecimento

Tipos de Conteúdo

Aprenda sobre itens de texto, PDF e URL

Variáveis e Conteúdo Dinâmico

Use referências de conhecimento nas instruções

Teste Seu Agente

Teste como seu agente usa conhecimento

Primeiros passos

Criar

Testar

Lançar

Otimizar

Contas e subcontas

Rede de parceiros

Legal

​Visão Geral

​Os Dois Métodos de Acesso

Modo Contexto

Modo RAG

​Modo Contexto (Injeção de Prompt)

​Como Funciona

​Saída Formatada

​Quando Usar o Modo Contexto

​Vantagens do Modo Contexto

Sempre Disponível

Melhor para Conjuntos Pequenos

Determinístico

Funciona com Variáveis

​Limitações do Modo Contexto

​Modo RAG (Geração Aumentada por Recuperação)

​Como Funciona

​Recuperação Inteligente

​Vantagens do Modo RAG

Escala Infinitamente

Mais Rápido para Conhecimento Grande

Eficiente

Melhor para Diversidade

​Considerações do Modo RAG

​Indicador de Tokens de Contexto Restantes

​Entendendo o Indicador

​Escolhendo o Modo Certo

​Abordagem Híbrida

​Testando Sua Configuração

​Melhores Práticas

​Solução de Problemas

​Próximos Passos

Criar Bases de Conhecimento

Tipos de Conteúdo

Variáveis e Conteúdo Dinâmico

Teste Seu Agente

Visão Geral

Os Dois Métodos de Acesso

Modo Contexto (Injeção de Prompt)

Como Funciona

Saída Formatada

Quando Usar o Modo Contexto

Vantagens do Modo Contexto

Limitações do Modo Contexto

Modo RAG (Geração Aumentada por Recuperação)

Como Funciona

Recuperação Inteligente

Vantagens do Modo RAG

Considerações do Modo RAG

Indicador de Tokens de Contexto Restantes

Entendendo o Indicador

Escolhendo o Modo Certo

Abordagem Híbrida

Testando Sua Configuração

Melhores Práticas

Solução de Problemas

Próximos Passos