Saber identificar IA é mais urgente do que criar; entenda riscos

Um levantamento recente da Sala Digital, parceria da Band com o Google, revelou um dado intrigante e preocupante: o interesse de busca por "como criar/fazer/gerar inteligência artificial" é significativamente maior do que as pesquisas por "como descobrir/detectar/identificar/saber inteligência artificial". Essa disparidade está relacionada aos novos vídeos ultra realistas - e acende um alerta importante em um momento em que a IA generativa se torna cada vez mais acessível e presente em nosso cotidiano digital. Isto é, se mais pessoas buscam criar do que entender como reconhecer o que foi criado, estamos diante de um potencial problema de desinformação e perda de capacidade crítica.

A Inteligência Artificial já está presente em praticamente todos os produtos e serviços, com avanços notáveis no aprendizado profundo. No entanto, seu uso massivo e o fácil acesso às ferramentas gerativas trazem riscos consideráveis que a sociedade precisa estar preparada para enfrentar.

Os riscos do uso desenfreado da IA

A proliferação de conteúdos gerados por IA, sem a devida identificação ou verificação, pode ter repercussões devastadoras. A McKinsey, por exemplo, estima um prêmio anual de US$ 4,4 trilhões para empresas que souberem integrar agentes de IA autônomos até 2030, mas o desafio real está em reconstruir processos e culturas para essa nova era. Se não soubermos identificar o que é gerado por máquinas, os riscos se amplificam:

Desinformação e deepfakes: a capacidade de criar vídeos e áudios falsos (deepfakes) extremamente convincentes é cada vez mais acessível, tornando difícil discernir entre o real e o fabricado. Já vimos casos de fraudes milionárias baseadas em deepfakes.
Plágio e violação de direitos autorais: ferramentas de IA frequentemente buscam inspiração em conteúdos existentes na internet, levantando preocupações sobre a autenticidade e a legalidade das peças geradas. A mera reprodução de conteúdos protegidos sem citar fontes compromete a integridade intelectual.
Vieses e discriminação: sistemas de IA podem reproduzir e até amplificar preconceitos presentes nos dados de treinamento, levando a decisões discriminatórias em áreas sensíveis como contratação, justiça, saúde e segurança.
Erosão da confiabilidade: a presença de erros flagrantes e informações falsas em artigos científicos gerados por IA já chama a atenção de pesquisadores e editoras, ameaçando corroer a reputação da ciência como instituição confiável.
Impactos sociais: mudanças no mercado de trabalho com a substituição de tarefas humanas, riscos à segurança da informação e privacidade, e até a criação de "bolhas" informacionais baseadas em personalização algorítmica são preocupações reais.

Como identificar conteúdos gerados por IA?

Com a evolução rápida das ferramentas de IA, distinguir o que foi criado por um humano do que foi gerado por uma máquina se torna um desafio crescente. No entanto, existem características e técnicas que podem ajudar, segundo especialistas:

Padrões linguísticos e de estilo: textos de IA podem apresentar construções de frases mais simples, repetições desnecessárias, falta de variação no comprimento das frases e um estilo homogêneo e mecânico.
Expressões típicas: algumas ferramentas de IA têm palavras e frases preferidas, como "em resumo", "é crucial", excesso de advérbios em "-mente" e expressões de ênfase.
Falta de profundidade ou nuance: o conteúdo gerado por IA pode parecer superficial, não capturando a complexidade de um tópico ou expressando opiniões apuradas (a menos que explicitamente instruído).
Sintaxe estranha e uso incomum de palavras: embora gramaticalmente corretos, os textos podem ter construções desajeitadas ou uso de palavras que não são típicos de falantes nativos, como uso frequente de iniciais maiúsculas em títulos (imitando o inglês) e uso intensivo de gerúndio.
Generalizações vagas: tendência a responder a perguntas diretas com informações imprecisas ou evasivas.
Referências temporais desatualizadas: dificuldade em lidar com eventos atuais ou informações que mudam rapidamente.
Alucinações: a ferramenta pode apresentar informações falsas, imprecisas ou inventadas com bastante convicção.
Verificação de similaridade: pesquisar frases ou trechos em mecanismos de busca pode revelar se partes do texto foram copiadas de outros locais.
Análise visual (para imagens): em ilustrações ou vídeos gerados por IA, procure por pequenos defeitos em elementos como olhos e mãos, ou iluminação em ângulos sem sentido.

Ferramentas de Detecção de IA: Aliadas com Limitações

Existem ferramentas online que prometem ajudar na identificação de conteúdo gerado por IA. Algumas populares incluem GPTZero, Smodin, Copyleaks, Writer AI, Content at Scale AI, Zero GPT, Sapling, Hive AI, Originality.AI, Perplexity IA.

No entanto, é fundamental entender que nenhuma ferramenta pode determinar com 100% de certeza se um conteúdo foi gerado por IA. Estudos mostram que a precisão varia e que elas podem gerar muitos falsos positivos (marcar texto humano como IA) ou falsos negativos (marcar texto de IA como humano). A simples edição manual de um texto gerado por IA já pode torná-lo mais difícil de ser detectado.

Recentemente, um estudo de uma agência de SEO comparou diversas ferramentas e concluiu que o ZeroGPT apresentou a maior precisão para conteúdos em português, embora ainda não seja perfeito. Outros testes indicam que ferramentas como Copyleaks podem ter baixa confiabilidade para o nosso idioma.

A dificuldade na detecção não está apenas na limitação das ferramentas, mas também no fato de que a própria IA é treinada com vastas quantidades de texto humano, aprendendo a imitar o estilo.

A necessidade de regulamentação

Diante dos riscos e da dificuldade em identificar a origem do conteúdo, a discussão sobre a regulamentação da IA se torna crucial. No Brasil, o Projeto de Lei 2338/2023 surge como uma tentativa de estabelecer normas gerais para o desenvolvimento e uso responsável de sistemas de IA.

O PL, já aprovado no Senado e agora em tramitação na Câmara dos Deputados, busca equilibrar a inovação tecnológica com a proteção dos direitos fundamentais. Ele propõe um modelo baseado em riscos, classificando sistemas como de risco excessivo (proibidos) e de alto risco (sujeitos a regras mais estritas, como Avaliação de Impacto Algorítmico). Áreas como saúde, educação, emprego e justiça são consideradas de alto risco. Pontos importantes do projeto incluem:

Direitos dos afetados: garantia de informação prévia sobre a interação com IA, direito à explicação, contestação e revisão humana de decisões significativas.
Não discriminação: medidas para mitigar e corrigir vieses em dados e algoritmos.
Responsabilidade: estabelecimento de regras de responsabilidade civil para danos causados por sistemas de IA.
Direitos autorais: permissão limitada para o uso de conteúdos protegidos por instituições de pesquisa, jornalismo, museus, arquivos, bibliotecas e educacionais para mineração de dados sem fins comerciais. Para demais usos comerciais no desenvolvimento de sistemas, o titular terá direito a remuneração.
Governança: exigência de estruturas e processos internos para garantir segurança, transparência e mitigação de riscos.
Autoridade competente: a Autoridade Nacional de Proteção de Dados (ANPD) é proposta para coordenar o Sistema Nacional de Regulação e Governança de Inteligência Artificial (SIA), zelar pela implementação e aplicar sanções.

No entanto, a regulamentação ainda é objeto de debate. Críticos apontam a timidez do projeto em relação a deepfakes, preocupações com a efetividade no combate à discriminação algorítmica, debates sobre o excesso de regulação que poderia inibir a inovação, e discussões sobre a exclusão dos algoritmos de redes sociais da lista de alto risco. O setor produtivo, por exemplo, manifestou preocupação com a exigência de remuneração por conteúdo protegido e divulgação de dados de treinamento, temendo afastamento de investimentos.

Fique bem informado!

Receba gratuitamente as notícias mais importantes do dia direto no seu e-mail

Escolha quais newsletters quer receber

Li e concordo com os Termos de Uso e Políticas de Privacidade

Tópicos relacionados

Notícias Sala Digital