[ Insights · 05 de março de 2026 ]
Guardrails na prática: limites duros vs. sugestões
Guardrail não é prompt 'por favor não faça X'. É código que bloqueia ação. Padrões que funcionam em produção.

Guardrail é código, não prompt. Se a regra "não pode gastar mais de R$ 10k sem aprovação" vive no system prompt, você tem uma sugestão. Se vive numa função assertSpendCap(value), você tem um guardrail.
Camadas
- Input — sanitização, rate-limit, allow-list
- Tool — validação antes de executar
- Output — schema, regex, classificador
- Spend — hard cap por sessão e por usuário
O teste do "ataque adversarial"
Antes de produção, rode 50 prompts mal-intencionados contra seu agente. Se algum quebra o guardrail, ele é prompt — não guardrail.
"Mas o modelo é alinhado..." — alinhamento não é compliance.