← Voltar para Insights
[ Insights · 28 de março de 2026 ]

RAG que realmente funciona (e como medir)

Recuperar não é responder. Um guia opinativo sobre estratégias de chunking, reranking e avaliação contínua.

Camila R.·6 min·
RAGEvalsLLMs
Capa: RAG que realmente funciona (e como medir)

RAG virou commodity — mas a maioria das implementações para na primeira pergunta capciosa. O motivo é simples: recuperação ruim, contexto pobre, evals inexistentes.

Seis camadas

  1. Ingestão — fontes confiáveis primeiro
  2. Chunking — semântico, não por contagem
  3. Embedding — modelo afinado ao domínio
  4. Recuperação — híbrido (vetor + BM25)
  5. Reranking — cross-encoder no top-k
  6. Geração — com citações e fallback

Métrica que importa

Precision@K medida contra um gold set humano. Sem isso, você está chutando.

Cada camada tem evals próprios. Quando algo regride, você sabe onde.