Na última semana, a OpenAI, empresa de tecnologia responsável pelo gerador de texto, Chat GPT, e pelo gerador de imagens DALL-E, revelou seu gerador de vídeos, o Sora. Os resultados são impressionantes, apesar de totalmente controlados pela empresa, dado que o modelo ainda não está disponível para os usuários. Já podemos imaginar as abominações que aparecerão por aí quando estiver, como quando artistas rapidamente perceberam a predileção do DALL-E 2 por pessoas com seis dedos nas mãos e nos pés.
O desenvolvimento não é uma surpresa. Finalmente, a tecnologia por trás é razoavelmente parecida com a que gera texto e imagens. Era uma questão de como otimizar o processo de geração e treinamento para gerar um recurso tão pesado como um vídeo. Isso e muito dinheiro para garantir o poder computacional para realizar tal feito, algo que conseguiram através da intensa especulação financeira em torno das tecnologias de “inteligência artificial” e sua capacidade de substituir em larga escala um grande número de assalariados.
Discutimos diversas vezes nesse espaço como essas tecnologias não são de fato inteligentes, como querem que acreditemos os marqueteiros. São modelos estatísticos que, com base numa enorme amostra usada em seu treinamento, tornam-se capazes de prever as palavras, imagens ou vídeos que mais provavelmente se relacionam ao prompt que receberam. Isso não quer dizer que não achemos o resultado impressionante, mas é fundamental separar esse resultado das expectativas infundadas de especuladores de que estamos diante de um organismo digital autônomo com capacidades de dominação mundial. Não, não estamos próximos de uma distopia ao estilo de Matrix e outras.
Há, porém, outros interesses relacionados a essa campanha terrorista contra os geradores automáticos de memes. Além da especulação, atores políticos estão muito preocupados em como essas ferramentas podem ser usadas contra eles (poucos parecem interessados em pensar como elas podem ser utilizadas em seu favor, como já mencionamos aqui no caso do ex-primeiro-ministro paquistanês, Imran Khan). Geração de voz, um tema pouco mencionado nas publicações casuais de tecnologia, pode ter resultados impressionantes a depender da disponibilidade de amostras públicas de áudio da voz de uma determinada pessoa. Combinado à capacidade de se gerar vídeos, agora é possível não apenas forjar uma fala muito convincente que nunca ocorreu, como um vídeo que acompanhe essa fala.
Mais do que isso, com esses modelos e certo conhecimento técnico, é possível forjar falsidades em larga escala. É como se um indivíduo ou um pequeno grupo de indivíduos tivesse a mesma capacidade de gerar mentiras que todo o conglomerado imperialista de imprensa internacional. Tudo sem sair de casa. Querem um exemplo? Basta ver como a internet agora está povoada de páginas claramente geradas por geradores de lero-lero à la Chat GPT, infernizando a vida de pessoas acostumadas a utilizar buscadores tradicionais de internet para encontrar o conteúdo que desejam. Recentemente tenho sido forçado a usar o GPT como buscador. Imaginem o que será do YouTube, com a disponibilização do Sora ao público geral…
Mas voltando à fábrica de mentiras, vemos essa tendência em outras situações. No Mar Vermelho, o imperialismo gasta mil vezes mais que o exército iemenita para abater um de seus drones com seus mísseis caríssimos de alta precisão. A “democratização” da tecnologia militar é uma ameaça para o imperialismo, assim como a democratização da fábrica de mentiras. Se já não aguentavam as pessoas manualmente enviando suas postagens às redes sociais, que dirá agora, com a capacidade de criar uma realidade alternativa completa, com vídeos, áudios, imagens, e textos elaborados artificialmente? Se combinarmos isso com alguns scripts, podemos criar vários portais que corroborem uns aos outros, como faz o cartel de imprensa imperialista com AP News, Reuters, The New York Times, The Guardian, Washington Post, CNN, etc…