Uma base de conhecimento (Knowledge Base – KB) é o cérebro do seu agente de IA. É a fonte da verdade que ele consulta para responder aos usuários. Uma base bem construída não apenas fornece respostas corretas, mas também aumenta a confiança do usuário e a eficiência do agente.
Este guia apresenta um método estruturado para criar e manter uma base de conhecimento de alta performance, de forma agnóstica a plataformas ou segmentos:
Fase 1: planejamento e estratégia
Antes de escrever a primeira linha, é crucial definir a estratégia.
-
Defina o propósito do agente: qual problema principal o agente deve resolver? Suporte técnico, vendas, dúvidas institucionais? O propósito guiará todo o conteúdo.
-
Identifique o público-alvo: quem fará as perguntas? Clientes, funcionários, parceiros? A linguagem, o tom e a profundidade das respostas devem ser adequados a eles.
-
Mapeie a jornada do usuário: quais são as dúvidas mais comuns em cada etapa da interação com a empresa? Antecipar essas necessidades ajuda a criar um conteúdo proativo.
-
Auditoria de conteúdo existente: reúna toda a documentação disponível (FAQs, manuais, políticas, e-mails de suporte, etc.). Este será o material bruto para a sua base.
Fase 2: a arquitetura da informação
Esta é a fase central, onde a informação bruta é transformada em conhecimento estruturado para o agente. A unidade fundamental dessa arquitetura é o par de intenção-resposta.
O modelo da "unidade de conhecimento"
Cada pedaço de informação deve ser encapsulado em uma unidade de conhecimento clara e completa. Isso garante que a IA tenha todo o contexto necessário para recuperar a resposta certa.
Uma unidade de conhecimento ideal contém:
-
Título / tópico principal: um nome claro e direto para o assunto
-
Exemplo: política de devolução de produtos
-
-
Contexto: uma descrição curta e objetiva que define o escopo do tópico
-
Exemplo: regras e procedimentos para devolução de itens comprados no e-commerce
-
-
Sinônimos e palavras-chave: termos alternativos que os usuários podem usar
-
Exemplo: troca, devolver produto, cancelamento de compra, logística reversa, arrependimento de compra
-
-
Perguntas frequentes (intenções): de 5 a 10 variações de como um usuário pode abordar o tema
-
Exemplo:
-
como faço para devolver um produto?
-
qual o prazo para pedir a troca?
-
posso cancelar minha compra depois de recebida?
-
quero meu dinheiro de volta, como proceder?
-
a devolução tem custo?
-
-
-
Resposta canônica (a fonte da verdade)
-
Esta é a resposta oficial, final e validada
-
Regra de ouro: a resposta não deve ser modificada. Qualquer alteração deve passar por um processo formal de validação
-
Exemplo:
“O prazo para solicitar a devolução de um produto é de 7 dias corridos a partir da data de recebimento. O processo deve ser iniciado através do nosso portal do cliente, na seção ‘Meus pedidos’. A primeira devolução é gratuita e o estorno do valor será realizado na mesma forma de pagamento em até 10 dias úteis após o recebimento do produto em nosso centro de distribuição.”
-
Fase 3: redação e formatação do conteúdo
A qualidade do texto é tão importante quanto a estrutura.
-
Clareza e simplicidade: use linguagem direta e evite jargões. Frases curtas são mais fáceis de processar
-
Atomicidade: cada unidade de conhecimento deve tratar de um único assunto. Divida conteúdos com múltiplos temas em unidades menores
-
Consistência: mantenha o tom de voz e a terminologia uniformes em toda a base
-
Formatação para IA:
-
FAQs: mantenha pergunta e resposta próximas no documento (mesma linha em CSV ou sequenciais em DOCX)
-
Manuais/documentos longos: remova sumários, cabeçalhos e rodapés; se necessário, divida por capítulos
-
Dados estruturados: em CSV/XLSX, use nomes de colunas claros (ex: pergunta, resposta, contexto)
-
Formatos de arquivo e recomendações
A escolha do formato de arquivo impacta diretamente o desempenho do agente.
Tipo de conteúdo | Formato do arquivo | Recomendações | Restrições/Limites |
---|---|---|---|
FAQs | XLSX, CSV | Perguntas e respostas na mesma linha. Coluna obrigatória: text (minúsculas) | — |
DOCX, PDF | Perguntas e respostas próximas e em sequência | DOCX: até 1 milhão de caracteres PDF: até 250 mil | |
TXT, MD | Perguntas e respostas na mesma linha ou em linhas sequenciais | TXT: até 500 KB ou 500 mil caracteres | |
Manuais, relatórios | PDF, DOCX | Remover sumários. Evitar imagens ou garantir que as informações estejam em texto | DOCX: até 1 milhão PDF: até 250 mil caracteres |
TXT, MD | Remover sumários | TXT: até 500 KB ou 500 mil caracteres | |
Apresentações (PPTX) | PPTX | Verificar se o conteúdo relevante está em texto nos slides | Até 30 MB |
Estrutura isolada | JSON | Ideal para parágrafos soltos e informações curtas (até 700 caracteres). Campo obrigatório: text | — |
Fase 4: manutenção e evolução contínua
Uma base de conhecimento é um organismo vivo.
-
Ciclo de revisão: revise e valide o conteúdo periodicamente (ex: a cada 3 ou 6 meses)
-
Gestão de versões: ao atualizar, exclua versões antigas. Evite duplicidades na base
-
Feedback loop: analise os logs de conversas. As perguntas que o agente não responde são valiosas para identificar lacunas de conhecimento
O raciocínio por trás do modelo
Por que essa estrutura funciona? O objetivo do agente de IA não é "entender" como um humano, mas mapear com precisão a pergunta à melhor resposta disponível.
1. Redução da ambiguidade
O uso de contexto e sinônimos ajuda a IA a distinguir significados semelhantes (ex: "banco" como instituição ou assento).
2. Aumento da precisão na recuperação
As perguntas frequentes funcionam como um treino direto. Elas ajudam a IA a identificar diferentes formas de expressar a mesma intenção.
3. Garantia de confiabilidade
A regra de manter a resposta canônica intacta evita que a IA invente ou distorça informações. Isso aumenta a confiança do usuário.
Este método transforma informações brutas e desorganizadas em unidades de conhecimento ricas em metadados e contexto. O resultado: agentes mais precisos, rápidos e confiáveis.