Você não precisa de uma IA que “responda qualquer coisa”. Precisa de modelos que executem exatamente o que o negócio exige, com governança, evidências e resultado operacional. No Money20/20, o painel “The Future of AI in Finance” com Mike Krieger (CPO, Anthropic), moderado por Mackenzie Sigalos (CNBC), cravou três mensagens para o setor:
o avanço virá de melhorias direcionadas em modelos especializados, não de promessas genéricas;
automação cognitiva já está em piloto com executivos e analistas, priorizando clareza operacional;
IA deve operar como um sistema científico: medir, aprender, ajustar — e agir a partir da intenção humana.
O mercado espera respostas perfeitas; a operação precisa de execuções corretas. Krieger foi claro: pequenas melhorias direcionadas no modelo certo (domínio/uso) geram avanços maiores do que trocas amplas e caras.
Implicação: troque o fetiche do “modelo campeão” por uma carteira de modelos especializados, cada um com SLOs de precisão e requisitos de dados claros.
Ações práticas
Defina SLOs por caso (ex.: acerto ≥ 95% na extração de campos de contrato; latência ≤ 1s em reconciliação).
Implemente controle de distribuição: quem pode usar qual modelo, para quê, com quais dados.
Construa dataset de referência (golden set) para cada tarefa crítica e rode testes de regressão contínuos.
O piloto da Anthropic com ~100 executivos/analistas foca tarefas repetitivas de alto custo cognitivo: follow-ups, extração estruturada, interpretação de análises. A infraestrutura é propositalmente simples (comparada a trading de G-SIBs) para testabilidade e clareza operacional.
Pergunta de negócios: até onde substituir tarefas de analistas sem perder governança e leitura crítica?
Ações práticas
Mapear o ciclo analítico por etapa (coleta, limpeza, extração, interpretação, recomendação) e automatizar blocos com handoff humano nos pontos de maior materialidade.
Medir custo por tarefa, tempo de ciclo, qualidade de evidência e aderência à política (suitability/adequação).
Registrar porquês (explainability) e provas de uso (quem, quando, qual fonte, qual versão do modelo).
O objetivo não é “responder bem”; é executar certo com evidência. A abordagem é hipótese → teste → evidência → decisão → próxima ação. O modelo V2 prioriza dados críticos e contexto, com ciclos de refinamento orientados por métricas.
Ações práticas
Instituir rituais quinzenais de revisão: error analysis, drift, hallucination rate, output coverage.
Ativar guardrails (políticas executáveis) e fallbacks: quando escalar para humano, quando pedir dado adicional.
Manter catálogo de modelos com versões, feature store, data lineage e SLA/SLO por caso.
KYCustomer, Evolved: dados Classe 1/2 (oficiais/governamentais) como padrão de confiança para treinar/avaliar modelos.
🎧 DoTheMATH — Episódio recomendado
IA que executa. Governança que sustenta. Valor que aparece.
A MATH AI Platform conecta dados críticos, modelos especializados, guardrails e agentes de decisão num único fluxo auditável.
Agende um diagnóstico de 30 minutos para mapear 3 casos de precisão aplicada onde um modelo especializado entrega ROI em 90 dias.