Sobre Deepfakes, IA e como no futuro ninguém vai ligar se ver a Sandy pelada

Compartilhe este artigo!

Nos primórdios da Internet, “Sandy Pelada” era um proto-meme, um clickbait que todo mundo usava e o Google odiava. Aliás, ainda odeia e provavelmente este artigo vai ser enterrado nas profundezas do SEO, mas who cares?

Apesar de centenas de milhares de instalações de viri (o plural nerd de vírus) bem-sucedidas graças ao sandypelada.exe, essa promessa não se concretizou. Até hoje.

Não que fakes fossem escassos, o povo se esmerava no Photoshop (ok, a maioria no Paint) mas o resultado era patético. Ninguém com bom-senso via aquelas montagens como reais. Havia até o Fake Detective, um site de um sujeito que identificava e

Desmentia mesmo os fakes mais elaborados.

Claro, um verdadeiro artista, com habilidades míticas no Photoshop conseguiria criar fakes absolutamente perfeitos, e no auge da Playboy isso era feito direto. Nem sempre feito direito, claro. Em novembro de 2005 a Playboy publicou um ensaio da Mariana Kupfer, em uma das fotos o estagiário errou a mão e ela saiu… sem umbigo.

Por muito tempo essa capacidade de manipulação digital ficou fora do alcance do usuário comum, mas em 2017 um usuário do Reddit postou um vídeo demonstrando uma técnica chamada “Deepfake”, que trocava o rosto de uma pessoa em uma cena, pelo rosto de uma pessoa arbitrariamente escolhida.

Este vídeo é de fevereiro de 2021!

Isso, claro, foi imediatamente usado para o Mal, e a Internet foi inundada com deepfakes de atrizes famosas cometendo atos indescritíveis, e foi o fim da Internet. Ao memos, imaginava-se que seria.

A mídia entrou em pânico moral (como sempre) e previu infindáveis chantagens, extorsões, destruição de reputações e usos políticos, mas a realidade falou mais alto. Criar deepfakes era chato, trabalhoso e MUITO demorado, era quase na base vídeo a vídeo, e uma única composição podia levar dias num PC mediano, apenas para você descobrir que ficou uma bosta.

Nos últimos dois anos a explosão de conhecimento na área de Inteligência Artificial e Machine Learning gerou ferramentas inimagináveis no longínquo ano de 2017, e enterrou totalmente a tecnologia de DeepFakes.

Hoje é razoavelmente fácil (embora ainda trabalhoso) fazer um vídeo falso com qualidade “ok”.  Fotos, essas são mais fáceis ainda.

Este vídeo foi criado com base em uma imagem estática e uma amostra de voz. Todo o resto, movimentação, sincronia, narração, tudo feito via IA. E foi até fácil.

A grande preocupação é que essa tecnologia irá destruir a credibilidade da imprensa, da mídia visual, que logo fotos perderão seu valor, sua confiabilidade, e em seguida os vídeos também seguirão pelo mesmo caminho.

Eu vou contar um segredo: Essa confiabilidade nunca existiu. Desde que aa fotografia foi inventada, trucagens, efeitos e montagens foram criados para alterar a “realidade” das fotos.

A União Soviética é famosa por suas alterações, uma foto clássica mostra um grupo de jovens comunistas, liderados por Lênin. À medida que caíam em desgraça, eram um a um removidos das novas versões da foto, até que só sobrou o Lênin.

A clássica foto do soldado soviético erguendo a bandeira no alto do Reichstag, durante a Queda de Berlim? Não só foi encenada, como em Moscou os censores tiveram que alterar vários detalhes. Um deles: O soldado estava com um relógio em cada pulso, indicando que ele havia pilhado corpos de alemães mortos. Corre e apaga um deles!

E fake News? Bem, digamos que em 1860 uma foto do então candidato Abraham Lincoln foi (não-digitalmente) alterada para mostrá-lo ao lado de políticos escravagistas. Não deu certo.

Mussolini também adorava alterar fotos, tipo esta, onde faz uma pose de estátua, garboso em seu cavalo, mas discretamente removeu o assistente que segurava o bicho quieto.

Claro, a idéia de alterar imagens não surgiu com a fotografia.

Bem antes das fotos, as pinturas refletiam a realidade que seus autores queriam refletir.

Nem falo do Jesus loirinho europeu popular nas pinturas renascentistas, era jabá descarado mesmo.

Um exemplo clássico: Este quadro se chama “A Adoração dos Reis Magos”, foi pintado por Giotto entre 1305 e 1310. Foi uma encomenda de um tal Giovanni de Medici, que muito por acaso é o sujeito beijando os pés do Menino Jesus.

Os mecenas colocavam esposas, amantes ou a si mesmos nos quadros que encomendavam, os artistas achavam uma troca justa, e topavam. Alguns até repetiam a prática por conta própria, e apareciam nos próprios quadros como figurantes.

A clássica imagem de George Washington cruzando o Delaware? Com certeza já viu, é uma pintura muito famosa de Emanuel Gottlieb Leutze.

Só tem alguns detalhes: Eles cruzaram o Delaware à noite, a travessia foi de só algumas centenas de metros, naquela pose George Washington teria caído na água gelada, a bandeira na pintura só começou a ser usada dois anos depois, Washington tinha 44 anos, nem de longe era o coroa da imagem e…

Eles usaram chatas, barcos grandes e planos, não esse barquinho da imagem. Ah sim, Leutze estava na Alemanha quando pintou o quadro. Mas não foi tudo desatenção, ele pesquisou o máximo que conseguiu, e chegou a contratar turistas e estudantes americanos para posar para o quadro, garantindo mais autenticidade. Um detalhe interessante é que Leutze era um abolicionista ferrenho, e incluiu na obra (pintada em 1850) uma lacrada no melhor estilo Disney: Um dos personagens da pintura é negro, tornando a luta pela independência dos EUA um esforço multiétnico. Pena que George Washington tinha escravos…

Hoje não damos bola para pinturas e ilustrações, ninguém em sã consciência as consideraria representações fidedignas da realidade, mas nem sempre foi assim. E ainda não é. Pergunte a qualquer fiel como ele se sente quando alguém vandaliza a estátua de sua divindade favorita.

Essa percepção de que a representação tecnológica equivale à Realidade é bem exemplificada com o filme A Chegada do Trem à Estação, dos Irmãos Lumière, de 1896. Cinema era uma novidade tecnológica, as pessoas estavam vendo pela primeira vez imagens em movimento, e dizem que várias saíam correndo quando a cena do trem chegando na estação era exibida. Achavam que era de verdade.

Imagine se alguém chega com um filme mudo, em preto e branco, dizendo que é o Trump chutando cachorrinhos. OK, metade da esquerda do Twitter repassaria dizendo que é real, e a bolha da direita repassaria dizendo que o cachorro votou no PT, mas divago.

A capacidade de gerar imagens e vídeos falsos, de alta qualidade não é realmente o problema, o problema é a dificuldade das pessoas em exercer ceticismo, quando lhes convém, claro. Em verdade hoje é bem mais complicado convencer alguém.

No tempo da Europa Medieval um sujeito com uma espada, que não estivesse coberto de lama, se apresentaria como Arauto do Rei e faria o que quisesse. Um documento com um selo seria mais que suficiente para resolver quaisquer dúvidas, mesmo com basicamente ninguém sabendo ler. A palavra do Cavaleiro seria o suficiente.

Até a Guerra da Criméia (1853-1856), nenhum conflito havia sido fotografado em “tempo real”.  Um sujeito chamado Roger Fenton levou uma carroça com um laboratório fotográfico, ele registrava o dia-a-dia da Guerra, e mandava as fotos para Londres, via mensageiro. As reportagens iam via telégrafo. Ele mudou completamente a forma com que a população enxergava esses conflitos, então distantes.

A credibilidade das fotos não era questionada pelo grande público, embora gente do ramo acusasse Fenton de encenar algumas de suas fotos (o que é verdade).

Hoje vemos fotos do conflito em Gaza e algumas são hilárias, eu fiquei especialmente com dó do pobre menino palestino segurando seu gato de cinco patas:

Outras são mais sutis, várias passaram por verdadeiras, muitas continuam passando, mas de um modo geral o ceticismo da população tem aumentado, o que é bom.

Se eu chegar no Xwiter e postar que vi um sujeito vestido de Chapolim no centro da cidade, a maioria dos leitores vai acreditar, mas se eu xwitar que Israel lançou um ataque nuclear contra Gaza, só dois tipos repassarão imediatamente: O povo anti-Israel que é doido para que isso aconteça, e as pessoas que confiam tanto em mim que não cogitam que eu possa cometer erros. Ambos estão errados.

Uma notícia dessa monta não deve nem pode ser aceita com base apenas na palavra do mensageiro, mas nem sempre foi assim. Até a década de 1950 a notícia instantânea vinha via rádio, o que significava relato oral, com muita sorte uma entrevista gravada. O que valia era a credibilidade do veículo.

Sem streaming ao vivo, precisamos de vídeo para comprovar uma notícia. Sem vídeo, precisamos de fotos. Sem fotos, áudio. Sem áudio, textos oficiais. Historicamente exigimos mais e mais para comprovar a veracidade de uma informação, mas chegamos a um ponto em que tudo vai mudar.

5, 10 anos atrás um vídeo do Donald Trump participando de uma rinha de cachorros seria suficiente para -ok, não o afetar politicamente, mas para convencer todo mundo que ele ia em rinhas de cachorros. Hoje um vídeo comprometedor passa (ou deveria passar) por um bom escrutínio, antes de ser divulgado pela mídia responsável.

Ao mesmo tempo, fotos fakes não convencem mais, há até uma estratégia entre atrizes famosas, onde quando ocorre algum vazamento de fotos íntimas, se é possível elas minimizam dizendo que são fotos forjadas. Boa parte do público acredita, e não dá bola para o vazamento.

Boatos precisam pelo menos de um áudio suculento. Um boato somente em texto de que o Lula foi visto sacrificando crianças no porão do triplex não mereceria mais que um dar de ombros de qualquer jornalista minimamente competente.

Quer dizer, temos até fotos…

Estamos em um ponto em que afirmações extraordinárias precisam de provas extraordinárias, como dizia Carl Sagan, mas na esquina vem chegando a grande quebra de paradigma, quando as próprias provas extraordinárias perderão o sentido.

Pessoalmente acho que estamos muito melhor hoje, cercados de deepfakes e montagens, do que nos Anos 80, quando tudo que você precisava para espalhar um boato era uma boa lábia. Que o diga o Mário Gomes, que teve sua vida se não destruída, ao menos bem atrapalhada.

Uma época Mário pegou a Betty Faria, que era esposa do Daniel Filho. Como vingança, Daniel e Carlos Imperial espalharam um boato onde Mário Gomes havia sido levado ao hospital, com uma cenoura entalada no fiofó.

Não havia nenhuma comprovação, nada. Zero. Mas como ninguém tinha como exigir mais provas sem um inquérito formal, era o suficiente pro boato se espalhar. Também famoso é o boato que Rod Stewart foi levado para o hospital para ter o  estômago drenado, depois de, bem… servir oralmente uma tropa de marinheiros. A origem foi o assessor de imprensa demitido.

Hoje esse tipo de boato não vai longe, sem mais provas do que o disse-me-disse.

Ao contrário do boato de que Putin come cérebros de adversários. Temos provas!

O Que Vai Acontecer

Em breve, muito em breve o simples fato de um vídeo existir já não será suficiente para provar sua veracidade. Um dos métodos usados para identificar vídeos falsos são acontecimentos públicos de grande importância onde só há um único vídeo do tal acontecimento. Tipo OVNIs gigantescos sobrevoando a cidade e só um sujeito filmou.

Um acontecimento pra começar a ser levado a sério, terá que ser filmado por várias fontes, independentes, de ângulos diferentes. Descartaremos imediatamente vídeos, mesmo suculentos, que pareçam convenientes demais.

Mais adiante os vídeos perderão seus poderes. Um vídeo da Sandy Pelada nos Anos 70 seria especialmente impressionante, visto que ela nem havia nascido. Nos Anos 80 daria cadeia, seu pervertido. Já em 2001 todo mundo acreditaria, não havia tecnologia  para criar um deepfake  naquela época.

Hoje, o vídeo seria examinado sob um microscópio antes de ter sua veracidade atestada. As manchetes provavelmente falariam algo como “Sandy – Vítima de DeepFake?”, mas as pessoas ainda baixariam, pois quem sabe não é real?

Nada aqui existe.

Quando os vídeos via IA se acumularem, as pessoas vão se cansar, vão entender a facilidade com que esses vídeos são produzidos, e irão parar de dar bola pra eles. Vai se repetir o que aconteceu com o mercado de fotos fake: São tão simples de produzir que não tem mais graça, ninguém consome porque sabe que são fakes, e ninguém produz, pois não há público.

No campo social e político o vídeo sem contexto perderá sua capacidade de provocar reações. O que era uma prova cabal e definitiva para nós, nas primeiras décadas do Século XXI, será tão simples de ser adulterado que não será mais visto como prova de nada.

O que, curiosamente, explica tantos episódios de Jornada nas Estrelas que poderiam ter sido resolvidos com uma simples câmera de segurança, mas se você falsifica um vídeo com a mesma facilidade com que muda uma data em um arquivo do Word, o vídeo perde a credibilidade.

Então o futuro será oba-oba?

Não, padawan, nada de oba-oba, o que vai mudar, é que o vídeo deixará de ser essa panacéia universal da credibilidade, e se tornará mais um documento. Mesmo em 2023 um simples papel tem credibilidade, um simples testemunho é reconhecido em juízo. Só que a testemunha precisa ter sua credibilidade reconhecida pelo júri, e o papel precisa passar por uma perícia forense.

O vídeo, as gravações de voz serão usados para denúncias, desmascaramentos, ataques políticos e tudo mais que você puder imaginar, mas só serão levados a sério os vídeos e áudios devidamente autenticados.

Em um mundo ideal, seria o que já acontece hoje, mas a grande mudança é que a população irá se educar e não verá mais o vídeo como verdade automática (a não ser quando conveniente, claro)

Eu sei, eu sei, é complicado enxergar as coisas desse jeito, mas quebra de paradigma é assim mesmo. Imagine que você vive nos Anos 70, alguém aparece e diz que no futuro você vai fazer todas as suas transações bancárias pelo telefone. Você imagina naturalmente que será falando com o gerente. Nunca em um milhão de anos pensaria em algo como um smartphone.

O mundo está mudando muito rápido. Em 2014 esta era a imagem de uma vaca, criada via IA.

Hoje com meu humilde PC doméstico, eu crio em alguns segundos a Scarlett Johansson vestindo um bikini feito de pirulitos. Algum motivo especial? Nenhum, apenas porque eu posso.

Perceber que o mundo está mudando é complicado, piora bem mais quando a mudança afeta nossas crenças, comportamentos e atitudes. E é quase impossível entender e/ou aceitar que nosso comportamento futuro irá mudar.

Mesmo assim ninguém mais aparece para fazer visita sem avisar, ninguém mais fica preocupado em ficar na rua até mais tarde sem avisar o povo de casa, e ninguém mais carrega vouchers e cartão telefônico pra chamar táxi.

Enquanto legisladores procuram desesperadamente por formas de impedir que os nudes vazem no futuro, que as donzelas sejam vilipendiadas com deepfakes e que os políticos de estimação não sejam retratados comendo bebês, a realidade é que… vamos ver tudo isso em nossos celulares, e ninguém vai dar bola.


Compartilhe este artigo!