As três leis inversas da I.A.

O texto apresentado abaixo é uma tradução adaptada por Dheison Gomes para treinar e aumentar o próprio vocabulário na lingua inglesa, erros podem ter ocorrido durante esse processo. Caso encontre algo, faça um relato à ele via algum dos contatos disponíveis na página inicial.

Fonte: Three Inverse Laws of AI - susam.net

Introdução

Desde o lançamento do ChatGPT em novembro de 2022, serviços de chatbot de inteligencia artificial generativa(I.A) se tornaram crescentemente mais sofisticados e populares. Esses sistemas agora estão integradas em serviços de pesquisa, ferramentas de desenvolvimento de softwares e também em softwares de escritório. Para muitas pessoas, elas se tornaram rapidamente parte do dia-a-dia da computação.

Esses serviços se tornaram muito uteis, especialmente para explorar tópicos em que não temos familiaridade e para ajudar com a produtividade de forma geral. De qualquer forma, Eu também penso que da forma como esses serviços são anunciados e consumidos, eles podem se posicionar de forma perigosa para a sociedade, especialmente se nós construirmos o hábito de confiar nas respostas sem checarmos a veracidade delas.

Armadilhas

Algumas escolhas de designer em sistemas de I.A modernas podem encorajar a aceitação de suas respostas sem criticar. Por exemplo, muitas da ferramentas de pesquisa já estão mostrando respostas geradas por I.A diretamente no topo da página. Quando isso ocorre, é fácil de rolar a tela, aceitar a resposta gerada e seguir em frente. Ao passar do tempo, isso de modo descuidado pode treinar os usuários a tratar a I.A como a autoridade padrão ao invés de um ponto de entrada para investigação mais aprofundada. Eu desejo que cada um desses serviços de I.A venham com um breve mas conciso aviso explicando que o sistema pode as vezes produzir respostas que estão incorretas, errôneas ou incompletas. Esses avisos devem destacar que o a habitualidade de confiar nas respostas de I.A pode ser perigoso. Na minha experiência, esses avisos até mesmo existem, mas eles tendem a serem bem menos enfatizados visualmente.

No mundo da ficção cientifica, existem as Três leis da Robótica concebidas por Isaac Asimov, as quais se repetem ao longo de sua obra. Essas leis foram desenhadas para restringir o comportamento dos robôs de forma que mantenha os humanos seguros. Desde que sei, Asimov nunca formulou lei equivalente governando como os humanos devem interagir com os robôs. Eu penso que nós agora precisamos de algo que faça efeito para manter-nos seguros. Eu irei chamar elas de "Leis inversas da robótica". Essas se aplicam a qualquer situação que requeiram os humanos para interagir com um robô, onde o termo "robô" refere-se a qualquer maquina, programa de computador, serviço de software ou sistema de I.A que é capaz de fazer tarefas complexas automaticamente. Eu uso do termo "inverso" aqui não no senso negativo lógico mas para indicar que essas leis se aplicam para os humanos, não para os robôs.

Leis inversas da robótica

Aqui estão as três leis inversas da robótica

Humanos não devem antropomorfizar sistemas de I.A.
Humanos não devem blindar suas confianças em respostas de I.A.
Humanos devem se manter completamente responsáveis pelas consequências que surgirem do uso de sistemas de I.A.

Não-Antropomorfizar

Humanos não devem antropomorfizar sistemas de I.A. Isso é, humanos não devem atribuir emoções, intenções ou agencia moral a eles. Antropomorfizo distorce julgamentos. Em casos extremos, a antropomorfização pode levar a dependência emocional.

Eu penso que a linguagem que usamos quando estamos conversando sobre I.A deve refletir o fato de que ela é apenas uma ferramenta. Nós podemos fazer isso com pequenos ajustes na forma como falamos sobre I.A, por exemplo, ao invés de falarmos, "Eu perguntei ao ChatGPT", nós podemos dizer, "Eu questionei o ChatGPT". Similarmente, invés de dizermos, "O Claude falou", nós podemos dizer, "A resposta do Claude indica" ou "O Claude produziu". Isso pode parecer desnecessariamente pedinte, mas eu acho que esses pequenos ajustes ajudam na enfase de que esses sistemas são ferramentas.

Sistemas de chatbot modernos frequentemente soam conversacionais e empáticos. Eles usam frases polidas e dicas sociais que remontam de perto a interação humana. Enquanto isso faz elas se tornarem mais simples e prazerosas para usar, isso também faz se tornar fácil esquecer o que elas realmente são: modelos grandes de estatísticas produzindo texto plausível baseado nos padrões de dados.

Eu acho que fornecedores de serviços de chatbot baseados em I.A poderiam fazer um trabalho melhor aqui. Em muitos casos, os sistemas são deliberadamente sintonizados para parecerem mais humanos que mecânicos. Eu poderia argumentar que a abordagem oposta poderia ser mais saudável a longo tempo. Um tom suavemente mais robótico poderia reduzir a probabilidade que os usuários mais fluentes de uma linguagem causem erros no entendimento, julgamento ou intenção.

Independentemente se os fornecedores fizerem ou não essas mudanças, a responsabilidade de evitar essas ameaças continuará com os usuários. Nós devemos ativamente evitar o hábito de tratar os sistemas de I.A como atores sociais ou agentes morais. Fazendo isso nos preservamos o pensamento claro sobre as capacidades e limitações delas.

Não-blindar

Humanos não devem blindar sua confiança em respostas de sistemas de I.A. Conteúdos gerados por I.A não devem ser tratados como autoritativos sem verificação independente apropriada ao contexto.

Este principio não é unicamente para I.A. Em muitas áreas da vida, nós não devemos aceitar informações sem criticá-las. Na prática, claro, isso não é sempre viável. Nem todo mundo é especialista em medicina ou leis, então nós frequentemente dependemos da confiança em instituições e autoridades publicas de saúde para orientarmos. De qualquer forma, as orientações publicadas por essas instituições estão em muitos casos para revisão por especialistas em cada campo. Por outro lado, quando nós recebemos uma resposta para uma questão de um chatbot de I.A em uma sessão de conversa privada, não há ninguém ao lado para revisá-la particularmente estocasticamente a resposta gerada nos apresentada. Portanto, o ônus da examinação da resposta cai para nós.

Embora sistemas de I.A de hoje tenham se tornado muito impressionantes em certas tarefas, eles ainda são conhecidas por produzirem respostas que é um erro confiá-las. Até mesmo se os sistemas de I.A melhorarem ao ponto de produzir respostas confiáveis a alto nível de probabilidade, devido a sua inerente natureza estocástica, isso poderia manter uma pequena probabilidade de produzir respostas contendo algum erro. Isso faz elas particularmente perigosas em contextos onde os erros sutis são caros. Quanto mais serias e potenciais as consequências, mais alto deve ser o peso de verificar.

Em algumas aplicações como a formulação de provas matemáticas ou desenvolvimento de software, nós podemos adicionar uma camada de verificação automatizada na forma de checagem de provas ou testes unitários para verificar a resposta da I.A. Em outros casos, independentemente nós devemos verificar as respostas por nós mesmos.

Não-vicio de responsabilidade

Humanos devem se manter completamente responsáveis pelas decisões envolvendo I.A e responsável pelos problemas que surgem de seu uso. Se algo negativo ocorrer como resultado de seguir conselhos ou decisões geradas por I.A, não é suficiente falar, "a I.A nos falou para fazermos isso". Sistemas de I.A não escolhem objetivos, implementam elas mesmas ou arcam os custos da falha. Humanos e organizações fazem isso. Um sistema de I.A é uma ferramenta igual a qualquer outra ferramenta, a responsabilidade final por seu uso fica com a pessoa que decidiu em confiar nela.

Isso é mais fácil falar do que fazer, penso-eu. Eles obtém habilidades especiais em aplicações de tempo real como carros que se auto dirigem, onde um humano não tem a oportunidade de rever suficientemente as decisões tomadas pelo sistema de I.A antes que ele aja. Colocando um motorista humano em vigilância constante não resolve o problema pois os sistemas de I.A frequentemente agem em menos tempo que os humanos conseguem intervir. Apesar dessas serias limitações, nós devemos entender que se um sistema de I.A falhar nessas aplicações, a responsabilidade por investigar a falha e adicionar sistemas de segurança adicionais ainda deve cair para o humano responsável pelo design do sistema.

Em todos os outros casos, onde não há restrições físicas que previnem um humano de rever as respostas da I.A antes da ação, qualquer consequência negativa que surgir a partir do uso de I.A deve cair inteiramente sobre o humano que tomou a decisão de usa-lá. Como um principio geral, nós nunca devemos aceitar "a I.A nós disse" como uma desculpa aceitável para resultados perigosos. Sim, a I.A pode ter produzido a recomendação, mas o humano decidiu segui-la, dessa forma o humano deve ser culpado pelas consequências. Essa é uma forma absolutamente crítica para prevenir o uso indiscriminado de I.A em situações nas quais o uso irresponsável pode causar danos.

Conclusão

As três leis apresentadas acima são baseadas nos padrões de uso que eu vi e senti que causam detrimento na sociedade. Eu estou me importando com essas simples leis, nós podemos encorajar nossos humanos próximos a parar e refletir sobre a como interagimos com esses sistemas modernos de I.A, para resistir a esses hábitos de julgamento fraco ou responsabilidade embaçada - querer culpar a I.A - e manter na nossa mente que a I.A é uma ferramente que escolhemos usar, não uma autoridade final ao qual nos submetemos.