A aplicação de uma governança uniforme a todos os agentes de Inteligência Artificial, ignorando seu nível de autonomia e escopo, pode causar o fracasso dessas tecnologias nas empresas, segundo o Gartner, Inc. Os erros ocorrem quando as organizações não distinguem a capacidade de ação do agente e o limite de acesso concedido.
A projeção indica que, até 2027, 40% das companhias vão rebaixar ou desativar agentes autônomos por conta de lacunas detectadas após incidentes em produção. Para mitigar esses riscos, o Gartner recomenda uma abordagem proporcional que classifique a IA em quatro níveis distintos.
“As organizações estão tratando a governança de agentes de IA como binária, ou totalmente restrita ou totalmente confiável, e essa é a causa principal do fracasso. Os agentes operam em diferentes níveis de autonomia e em diferentes limites de confiança”, diz Shiva Varma, Diretor Analista Sênior do Gartner.
“Quando os mesmos controles são aplicados indiscriminadamente, as organizações enfrentam dois modos comuns de falha: restrição excessiva de agentes simples, o que retarda a entrega e estimula o desenvolvimento paralelo, ou restrição insuficiente de agentes mais autônomos, o que aumenta os riscos operacionais, de segurança e de conformidade”, complementa Varma.
No Nível 1 (Observação), as ferramentas têm acesso apenas para leitura e os resultados ficam visíveis só para quem solicitou, como em resumos de documentos. “Nesse nível, a governança deve se concentrar em controles básicos, como acesso a dados com escopo definido, autenticação de usuário, registro de uso e testes básicos de funcionalidade e segurança”, afirma Varma. Como o risco se limita à exposição de dados, os controles devem ser leves.
No Nível 2 (Aconselhamento), os sistemas geram recomendações ou rascunhos, mas humanos executam as ações manualmente. Embora o acesso seja de leitura, os relatórios gerados podem influenciar o julgamento humano por conta do viés da automação. “A governança aqui deve incluir o Nível 1 e se estender para abordar a qualidade dos resultados e a influência nas decisões por meio de testes de precisão e alucinação”, diz Varma.
O Nível 3 (Agir com aprovação) permite que os agentes gravem dados ou alterem configurações, mas cada ação exige aprovação humana explícita. “Nesse nível, a revisão humana só é eficaz se continuar sendo um controle significativo”, alerta Varma. Sem testes robustos e fluxos claros, as aprovações podem se deteriorar sob pressão de tempo ou fadiga, criando uma falsa sensação de segurança.
No Nível 4 (Agir de forma autônoma), os agentes executam tarefas de forma independente e os humanos revisam apenas exceções e relatórios. “Quando os agentes operam de forma autônoma, as ações ocorrem em escala e velocidade que podem ultrapassar a supervisão humana”, diz Varma. Por isso, este nível exige monitoramento contínuo, mecanismos de reversão rápida e travas de interrupção em caso de violações.
