[ Insights · 12 de abril de 2026 ]
Agentes em produção: do hype à infraestrutura
O que separa um agente de demo de um agente em produção é menos prompt e mais engenharia. Discutimos guardrails, evals e telemetria.

Agentes autônomos saíram do laboratório. Mas levá-los à produção exige um conjunto de práticas que pouco têm a ver com prompt engineering e tudo a ver com engenharia de software clássica.
As quatro frentes que quebram
- Guardrails — limites duros, não sugestões.
- Eval-loops — testar como se fosse software, não chat.
- Observabilidade — toda chamada, todo tool-use, todo custo.
- Custo — porque LLM em escala vira contabilidade.
Um agente sem evals é uma demo cara.
Por onde começar
Comece pequeno. Um único caso de uso, com evals desde o dia zero. Use ferramentas restritas. Logue tudo.
// exemplo: tool com guardrail
function createOrder(input: OrderInput) {
assertWithinSpendCap(input.value);
return db.orders.insert(input);
}
O que medir
- Pass-rate por categoria de caso
- Custo por tarefa (não por chamada)
- p99 latência ponta-a-ponta
- Taxa de fallback para humano
Sem essas quatro métricas, você está vibe-coding com agentes.