Notas de campo.
Ensaios curtos sobre engenharia de IA, agentes em produção, RAG, evals e o que vemos quebrar. 11 ensaios publicados.

Evals como software: o pipeline que ninguém constrói
Avaliar LLM é teste de software, não chat. Por que CI/CD para evals deveria ser padrão e não exceção.

Agentes em produção: do hype à infraestrutura
O que separa um agente de demo de um agente em produção é menos prompt e mais engenharia. Discutimos guardrails, evals e telemetria.

RAG que realmente funciona (e como medir)
Recuperar não é responder. Um guia opinativo sobre estratégias de chunking, reranking e avaliação contínua.

Observabilidade de IA: o que logar (e o que não logar)
Logging de LLM mistura compliance, custo e debug. O esquema que funciona para auditar 6 meses depois.

Guardrails na prática: limites duros vs. sugestões
Guardrail não é prompt 'por favor não faça X'. É código que bloqueia ação. Padrões que funcionam em produção.

Por que WebGL vende mais produto que screenshot
Interface 3D bem feita não é firula. É instrumento de venda. Quando vale e quando não vale o custo.

Edge vs Cloud: onde rodar o seu LLM
Latência, custo e compliance moldam onde sua inferência mora. Um mapa de decisão prático.

Automação de ERP com IA: o ROI dos próximos 18 meses
Casos reais de redução de 60% em ciclos administrativos via agentes integrados a ERPs legados.

O custo invisível: LLM em escala vira contabilidade
Quando o produto cresce, o custo de inferência sai da planilha de tecnologia e entra na de margem. Estratégias para não morrer pelo token.