RAG explicado: a diferença entre chatbot por palavra-chave e IA com base de conhecimento

RAG — Retrieval-Augmented Generation — é a técnica que permite a uma IA generativa acessar uma base de conhecimento externa antes de gerar uma resposta.
No modelo tradicional (chatbot por palavra-chave), o sistema busca correspondência exata ou fuzzy entre o que o usuário digitou e um banco de respostas pré-cadastradas. Se a correspondência não é encontrada, o bot responde "não entendi".
Com RAG, o fluxo é diferente: 1. O texto do usuário é convertido em um vetor (embedding) 2. Uma busca vetorial (pgvector no caso da GoSeny) encontra os trechos mais semanticamente similares na base de conhecimento 3. Esses trechos são enviados como contexto para o LLM 4. O LLM gera uma resposta natural, baseada no contexto real da empresa
Resultado: respostas próprias, não genéricas. IA com a sua base de conhecimento.