Visão Geral
O itellicoAI suporta três tipos de itens de conhecimento, cada um projetado para diferentes fontes de conteúdo e casos de uso. Entender como cada tipo funciona e como são processados ajudará você a escolher o formato certo para suas informações.Visão Geral dos Tipos de Conteúdo
Itens de Texto
Entrada direta de conteúdo usando o editor integrado
Upload de Arquivos
Faça upload de PDF, DOC, DOCX, TXT e outros formatos de documentos até 10MB
Scraping de URL
Extraia conteúdo de páginas web
Itens de Texto
O que são Itens de Texto?
Itens de texto são conteúdo que você insere diretamente no editor da base de conhecimento do itellicoAI. Eles são o tipo de conteúdo mais direto e confiável.Quando Usar Itens de Texto
Escrevendo FAQs
Escrevendo FAQs
Crie pares de perguntas e respostas diretamente no sistema.Exemplo:
Criando resumos de políticas
Criando resumos de políticas
Escreva declarações de política claras e concisas.Exemplo:
Documentando procedimentos
Documentando procedimentos
Instruções passo a passo para processos.Exemplo:
Informações de referência rápida
Informações de referência rápida
Informações breves e frequentemente referenciadas.Exemplo:
Criando Itens de Texto
Escreva o conteúdo
Digite seu conteúdo no editor. Use formatação para clareza:
- Títulos para seções
- Marcadores para listas
- Números para passos
- Negrito para ênfase
Exemplo JSON de Item de Texto
Vantagens dos Itens de Texto
Processamento Instantâneo
Itens de texto estão imediatamente disponíveis - sem atraso de processamento
Controle Total
Controle completo sobre formatação e estrutura de conteúdo
Atualizações Fáceis
Rápido para editar e atualizar quando as informações mudarem
Confiável
Sem erros de processamento ou problemas de extração
Itens de Upload de Arquivo
O que são Itens de Upload de Arquivo?
Itens de upload de arquivo permitem que você faça upload de documentos existentes em vários formatos. O sistema extrai o conteúdo de texto e o disponibiliza para seus agentes.Quando Usar Upload de Arquivos
Documentação existente
Documentação existente
Você já tem conteúdo em formato de documento.Exemplos:
- Manuais do usuário
- Especificações de produto
- Documentos legais
- Materiais de treinamento
Documentos formatados
Documentos formatados
Documentos com layouts específicos que são mais fáceis de manter como arquivos.Exemplos:
- Diagramas técnicos
- Tabelas e gráficos
- Layouts de múltiplas colunas
- Modelos de marca
Documentos de terceiros
Documentos de terceiros
Documentação que você recebe de fornecedores ou parceiros.Exemplos:
- Catálogos de fornecedores
- Documentos de conformidade
- Materiais de certificação
Requisitos de Arquivo
Especificações de arquivo:- Formatos: PDF, DOC, DOCX, TXT e outros formatos de documentos
- Limite de tamanho: Máximo de 10MB
- Conteúdo: Documentos baseados em texto e imagens digitalizadas (análise avançada lida com a maioria das digitalizações)
- Proteção: Sem proteção por senha
O sistema usa análise avançada de documentos para extrair texto de imagens digitalizadas e PDFs. A maioria dos documentos digitalizados será processada corretamente, embora digitalizações de qualidade muito baixa possam exigir entrada manual de texto.
Criando Itens de Arquivo
Exemplo JSON de Item de Arquivo
Tempo de Processamento
O tempo de processamento de arquivo varia com base em:- Tamanho do arquivo: Arquivos maiores demoram mais
- Contagem de páginas: Mais páginas = processamento mais longo
- Complexidade: Tabelas, imagens e layouts complexos retardam o processamento
- Qualidade do texto: Texto limpo e simples extrai mais rápido
- Arquivos pequenos (< 1MB, 10 páginas): 10-30 segundos
- Arquivos médios (1-5MB, 10-50 páginas): 30-90 segundos
- Arquivos grandes (5-10MB, 50+ páginas): 2-5 minutos
Problemas Comuns com Arquivos
Processamento falhou
Processamento falhou
Causas:
- Arquivo excede 10MB
- Arquivo está protegido por senha
- Arquivo está corrompido
- Imagens digitalizadas de qualidade muito baixa
- Comprima o arquivo ou divida em arquivos menores
- Remova a proteção por senha
- Reexporte o arquivo da fonte
- Para digitalizações de qualidade muito baixa, copie o conteúdo em um item de texto
Conteúdo extraído incorretamente
Conteúdo extraído incorretamente
Causas:
- Layouts complexos (múltiplas colunas, tabelas)
- Imagens digitalizadas de qualidade muito baixa
- Fontes ou codificação especiais
- Campos de formulário e elementos interativos
- Verifique o conteúdo extraído no modo de edição
- Recrie como item de texto com formatação adequada
- Simplifique o layout do documento antes do upload
- Exporte como documento de texto simples
Processamento demora muito
Processamento demora muito
O que fazer:
- Aguarde 5-10 minutos antes de assumir falha
- Verifique tamanho do arquivo e contagem de páginas
- Para arquivos grandes, considere dividir em vários arquivos
- Converta para texto e faça upload como itens TEXT
Melhores Práticas de Upload de Arquivo
Otimize antes do upload
- Comprima arquivos grandes
- Remova imagens desnecessárias
- Use documentos baseados em texto
- Mantenha abaixo de 5MB quando possível
Teste a extração
- Revise o conteúdo extraído após processamento
- Verifique problemas de formatação
- Verifique se informações críticas estão precisas
- Faça novo upload se a extração for ruim
Itens de URL
O que são Itens de URL?
Itens de URL fazem scraping de conteúdo de páginas web e os armazenam na sua base de conhecimento. Isso é útil para referenciar documentação online, centrais de ajuda ou postagens de blog.Quando Usar Itens de URL
Documentação pública
Documentação pública
Referencie documentação externa que você não mantém.Exemplos:
- Documentação de API (sua ou de terceiros)
- Bases de conhecimento públicas
- Artigos da central de ajuda
- Páginas de produtos
Conteúdo frequentemente atualizado
Conteúdo frequentemente atualizado
Conteúdo que muda regularmente e você quer manter atualizado fazendo novo scraping.Exemplos:
- Páginas de preços
- Disponibilidade de produtos
- Promoções atuais
- Páginas de status
Postagens de blog ou artigos
Postagens de blog ou artigos
Conteúdo educacional ou anúncios.Exemplos:
- Guias de instruções
- Artigos de melhores práticas
- Anúncios de produtos
- Tutoriais de recursos
Criando Itens de URL
Exemplo JSON de Item de URL
Requisitos de URL
URLs funcionais:- Publicamente acessível (sem login necessário)
- Páginas de conteúdo HTML simples
- Sites de documentação
- Postagens de blog e artigos
- Páginas de conteúdo estático
- Páginas que exigem autenticação
- Aplicações pesadas em JavaScript (SPAs)
- Conteúdo com paywall
- Conteúdo carregado dinamicamente
- Aplicações interativas
O scraping de URL funciona melhor com páginas web simples baseadas em texto. Aplicações web complexas podem não fazer scraping com sucesso.
Problemas Comuns com URL
Scraping falhou
Scraping falhou
Causas:
- Página requer login/autenticação
- URL está incorreta ou quebrada
- Conteúdo carrega via JavaScript
- Site bloqueia scraping (robots.txt)
- Página não existe (404)
- Verifique se a URL está publicamente acessível
- Teste a URL em janela anônima do navegador
- Verifique se a URL está completa e correta
- Copie o conteúdo manualmente em um item de texto
- Use exportação em PDF da página
Conteúdo incompleto ou errado
Conteúdo incompleto ou errado
Causas:
- Conteúdo renderizado por JavaScript não capturado
- Carregamento de conteúdo dinâmico
- Múltiplas abas/seções na página
- Comentários ou barra lateral em scraping em vez do conteúdo principal
- Inspecione o conteúdo em scraping no modo de edição
- Use URL direta para conteúdo específico
- Copie o conteúdo desejado em um item de texto
- Exporte a página como PDF e faça upload
Conteúdo fica desatualizado
Conteúdo fica desatualizado
Solução:
O conteúdo da URL é extraído uma vez no momento da criação. Para atualizar:
- Exclua e recrie o item de URL
- Ou copie o conteúdo atual em um item de texto para atualizações manuais
- Itens de texto manuais que você atualiza regularmente
- Exportações em PDF que você atualiza periodicamente
Melhores Práticas de URL
Teste acessibilidade
- Abra a URL em janela anônima
- Verifique se não há login necessário
- Verifique se o conteúdo está visível
- Garanta que a página carregue rapidamente
Revise conteúdo em scraping
- Verifique o conteúdo após scraping
- Verifique se o conteúdo correto foi capturado
- Procure problemas de formatação
- Confirme que não há conteúdo extra (anúncios, barras laterais)
Fluxo de Status de Processamento
Os itens de conhecimento passam por dois pipelines de processamento separados:- Processamento de Conteúdo - Extraindo texto de arquivos/URLs
- Indexação Vetorial - Preparando conteúdo para RAG (busca semântica)
Status de Processamento de Conteúdo
Isso rastreia a extração de conteúdo de texto da sua fonte.PENDING
Significado: Item criado, na fila para extração de conteúdoO que está acontecendo:
- Item foi salvo no banco de dados
- Aguardando worker de processamento
- Geralmente muito breve (segundos)
PROCESSING
Significado: O conteúdo do item está sendo extraído agoraO que está acontecendo:
- Para ARQUIVOS: Extraindo texto de PDF, Word, etc.
- Para URLs: Buscando e fazendo scraping da página web específica
- Para TEXTO: N/A (pula diretamente para COMPLETED)
COMPLETED
Significado: Extração de conteúdo finalizada com sucessoO que está acontecendo:
- Conteúdo foi extraído e armazenado
- Indexação vetorial começará automaticamente
- Item estará disponível quando a indexação for concluída
FAILED
Significado: Extração de conteúdo encontrou um erroO que está acontecendo:
- Extração de arquivo falhou (PDF corrompido, formato não suportado)
- Scraping de URL falhou (página não encontrada, bloqueada, requer autenticação)
- Conteúdo não está disponível para agentes
Status de Indexação Vetorial
Depois que o conteúdo é extraído, ele deve ser indexado para RAG (busca semântica). Isso permite que os agentes encontrem conhecimento relevante com base no significado, não apenas em palavras-chave.PENDING
Significado: Aguardando início da indexação vetorialO que está acontecendo:
- Processamento de conteúdo concluído com sucesso
- Na fila para geração de embeddings
- Geralmente breve (segundos a minutos)
INDEXING
Significado: Criando embeddings vetoriais para RAGO que está acontecendo:
- Conteúdo está sendo dividido em pedaços
- Embeddings de IA sendo gerados para cada pedaço
- Vetores sendo armazenados na base de conhecimento
INDEXED
Significado: Item está totalmente pronto para recuperação RAGO que está acontecendo:
- Embeddings vetoriais armazenados com sucesso
- Item pode ser recuperado via busca semântica
- Agentes agora podem usar esse conhecimento
FAILED
Significado: Indexação vetorial falhouO que está acontecendo:
- Geração de embedding encontrou um erro
- Item não aparecerá nos resultados RAG
- Pode estar disponível apenas para injeção de contexto
Ambos os status devem ter sucesso para funcionalidade completa:
- Status de Conteúdo: COMPLETED
- Status de Vetor: INDEXED
Tratamento de Erros
Quando Itens Falham
Se um item de conhecimento mostrar status FAILED:Identifique a causa
Causas comuns:
- Arquivos: Arquivo muito grande, corrompido, protegido por senha, imagem digitalizada
- URL: Autenticação necessária, link quebrado, conteúdo não acessível
Tente soluções
- Para Arquivos: Comprima, remova proteção, adicione camada de texto ou converta para texto
- Para URLs: Verifique acessibilidade, tente URL diferente ou copie conteúdo para item de texto
Prevenindo Erros
Prevenção de Arquivo
- Mantenha arquivos abaixo de 5MB
- Use documentos baseados em texto ou digitalizações de qualidade
- Remova senhas
- Teste com arquivo pequeno primeiro
Prevenção de URL
- Teste URL em modo anônimo
- Use páginas HTML simples
- Evite conteúdo autenticado
- Verifique compatibilidade com robots.txt
Monitorando Processamento
Indicadores do Painel
No painel da sua base de conhecimento, você pode ver o status de processamento rapidamente para cada item em suas pastas: Indicadores de status:- Marca de seleção verde = COMPLETED
- Ampulheta = PROCESSING
- Símbolo de pausa = PENDING
- X vermelho = FAILED
- Manual do Usuario.pdf - COMPLETED
- Guia de Inicio Rapido.pdf - PROCESSING
- Documentacao API - PENDING
- Manual Legado.pdf - FAILED
Processamento em Lote
Ao fazer upload de vários itens:- Itens processam sequencialmente ou em paralelo (dependente do sistema)
- Verifique depois de 5-10 minutos para lotes grandes
- Revise o status de cada item
- Corrija quaisquer falhas individualmente
Escolhendo o Tipo de Conteúdo Certo
Use esta árvore de decisão para selecionar o melhor tipo de conteúdo: Você tem conteúdo existente?- Não → Use TEXT (escreva diretamente)
- Sim, é um documento →
- Menos de 10MB → Use FILE
- Mais de 10MB → Extraia texto, use TEXT
- Sim, é uma página web →
- Publicamente acessível → Use URL (se scraping falhar, copie para TEXT)
- Não acessível → Copie conteúdo para TEXT
Recomendações Rápidas
| Sua Situação | Melhor Tipo de Conteúdo |
|---|---|
| Escrevendo FAQs do zero | TEXT |
| Tem documentos Word/PDF existentes | Upload como FILE |
| Tem documentos abaixo de 10MB | FILE |
| Tem documentos acima de 10MB | Divida em arquivos menores ou extraia para TEXT |
| Documentação web pública | URL (com TEXT como backup) |
| Conteúdo privado/autenticado | Copie para TEXT |
| Precisa de disponibilidade imediata | TEXT (sem atraso de processamento) |
| Formatação complexa importa | FILE |