A popularização das Inteligências Artificiais generativas nos encaminha para um outro momento histórico para discutir cópia e propriedade intelectual
O ano de 2023 até aqui tem tido um assunto praticamente incontornável quando se fala em tecnologias digitais e internet: Inteligência Artificial (IA). Boa parte do frisson no tema se dá pela rápida ascensão do ChatGPT, uma IA generativa (sistemas técnicos capazes de gerar textos e imagens de forma automatizada, baseados no aprendizado de máquina) desenvolvida pela OpenAI, empresa criada em 2015 nos Estados Unidos com um aporte inicial de U$ 1 bilhão de seus sócios – entre os mais conhecidos, Sam Altman, CEO da empresa, e Elon Musk, excêntrico bilionário e segundo homem mais rico do mundo segundo a Bloomberg.
O ChatGPT foi disponibilizado publicamente para qualquer pessoa usar, gratuitamente, em 30 de novembro de 2022. Em janeiro de 2023 havia chegado a 100 milhões de usuários, o que o coloca como a tecnologia de crescimento mais rápido da história até aqui.
INTELIGÊNCIA ARTIFICIAL: DIFERENTES ABORDAGENS
Existem várias entradas possíveis para a discussão sobre os efeitos das IAs no cotidiano global. De questões éticas sobre adoção em sala de aula, por exemplo, à mecanismos possíveis para regulação e cuidado destes sistemas para que evitem a propagação de racismo algorítmico, discursos de ódios e desinformação; de usos para trabalhos criativos de texto e imagem à questões filosóficas de simbiose entre a realidade humana e a realidade das máquinas – e uma possível superação da inteligência humana pela maquínica.
Da precarização do trabalho digital, agora também o trabalho criativo (designers, ilustradores, produção de “conteúdos” em geral) às implicações políticas no extrativismo desigual de dados norte-sul global, a partir da acentuação do colonialismo de dados (Couldry e Mejías, 2019; Lippold e Faustino, 2022), o que pode nos levar a um modo de produção ainda pior que o capitalismo (Mckenzie Wark, 2023), agora baseado também no controle do “vetor da informação”, aquelas tecnologias que coletam grandes quantidades de dados, os ordenam, gerenciam e processam para extrair valor – como as IAs generativas.
Opto aqui nesse texto por outra entrada, relacionada com uma pesquisa que tenho feito há 15 anos no Baixa Cultura: a discussão sobre criação, cópia e propriedade intelectual na internet. Nem todo mundo está feliz com o fato de que as IAs generativas como o ChatGPT e o Midjourney (usada para geração de imagens) podem escrever livros infantis, ganhar competições de arte ou escrever artigos acadêmicos.
A CULTURA E O CONHECIMENTO SÃO LIVRES PARA AS IAS?
Em 2021, durante a pandemia, lancei “A Cultura é Livre: uma história da resistência antipropriedade”, livro editado pela Fundação Rosa Luxemburgo e a Autonomia Literária que nasceu na busca de conceituar e contextualizar a cultura livre, ideia que se propagou a partir do software livre nos anos 1990 e ganhou destaque com as discussões em torno do livre compartilhamento de arquivos (“pirataria”) nos 2000.
A propagação da cultura livre esteve estreitamente ligada ao copyleft, que estabeleceu, a partir de uma licença de software livre, um conceito de requerer a posse legal de uma obra para renunciar a esta ao autorizar que todas façam o uso que desejarem da obra, desde que transmitam suas mesmas liberdades a outras.
A exigência formal da posse significou (e ainda significa) que nenhuma outra pessoa poderá colocar um copyright em cima de uma obra copyleft e tentar limitar o seu uso, tornando as obras licenciadas nessa proposta um comum a ser cuidado por todos – e transformando o copyleft em um dos grandes hacks no sistema de propriedade intelectual criado ainda no século XIX.
Do copyleft se originou, no início dos anos 2000, os Creative Commons, conjunto de licenças (e depois uma ONG com representações hoje em mais de 50 países) que expandiu a ideia da cultura e do conhecimento livre e potencializou a criação dos movimentos da Educação Aberta (Recursos Educacionais Abertos no Brasil), Ciência Aberta e OpenGlam (“galerias, bibliotecas, arquivos e museus abertos”), ainda hoje ativos globalmente. Estes movimentos defendem o acesso ao conhecimento – o de visível interesse público como a produção científica, livros didáticos, obras de museus e bibliotecas públicas – frente à sanha restritiva das empresas donas de direitos autorais de obras culturais e educacionais.
DISTINÇÃO ENTRE CÓPIA E ORIGINAL
A partir desse panorama sobre cultura livre feito no livro é que retorno à discussão da Inteligência Artificial. A popularização de sistemas como o ChatGPT nos encaminham para um momento histórico importante na discussão da propriedade intelectual – a começar pela própria distinção entre cópia e original, que é novamente trazida ao centro do palco, dado que vivemos num mundo cada vez mais dominado por múltiplas cópias reproduzidas por sistemas algorítmicos “inteligentes” e que todas as IAs funcionam principalmente com novas apresentações de ideias que já foram geradas (e registradas em computadores).
Nesse contexto, será possível reconhecer as fontes e identificar a autoria? Mais: é praticável fazer isso retroativamente, dado que o ChatGPT e o Midjourney já “engoliram” boa parte das bases de dados da internet sem ter autorização pra isso e seguem “regurgitando” o que engoliram a cada comando?
No ambiente jurídico, já há denúncias que questionam essa apropriação; três artistas iniciaram uma ação coletiva contra Stability.ai e Midjourney alegando violação direta e indireta de direitos autorais, dizendo que “estes sistemas pegaram bilhões de imagens de treinamento extraídas de sites públicos” e as usaram “para produzir imagens aparentemente novas por meio de um processo de software matemático”.
Entre especialistas em direito autoral, muitos se perguntam (como Lukas Gonçalves neste texto) se a extração de conteúdo de terceiros por estas IAs generativas pode ser considerado “fair use” (uso justo), mecanismo da Lei dos Estados Unidos que estabelece como uso justo a reprodução de trechos para fins como crítica, comentário, notícias, ensino ou pesquisa. Esse tipo de mecanismo de exceção, que sempre foi uma defesa do movimento da cultura livre para que grandes empresas da cultura (estúdios de cinema, gravadoras de música, conglomerados editoriais, entre outras) não impedissem práticas como as pequenas citações musicais e de vídeo para fins de estudo ou paródia, por exemplo, agora tem sido estabelecido como a interpretação usada pelos tribunais dos Estados Unidos para permitir alguns usos de mineração de dados necessários para estes sistemas de Inteligência Artificial funcionarem.
Pesquisadores da área indicam que, em breve, a quantidade de texto e imagem gerada por IAs tende a superar toda produção humana. Não é difícil imaginar: baseado no aprendizado de máquina, o potencial é tendencialmente infinito.
APROPRIAÇÃO DO ESPAÇO COMUM DAS IDEIAS
Decorre daí outra discussão sobre propriedade intelectual, a da “apropriação” do espaço comum (domínio público) das ideias. Um número muito grande de obras produzidas pode exaurir a quantidade de expressões possíveis de uma ideia em um certo meio – música, por exemplo, onde já há casos de IAs, como a do Google Assistente, que reconhece os samplers de uma música, trechos de até menos de 1s. Identificar pode significar também controlar e restringir; quem já subiu um vídeo com uma música protegida por copyright no Youtube, Instagram ou outra plataforma sabe como, pela justificativa de defender a propriedade, as empresas de tecnologia já identificam e barram rapidamente a circulação de informações.
O rapper brasileiro Don L entendeu esse perigo e escreveu no Twitter: “O capitalismo vai acabar com a arte do sample. Sou totalmente contra ter que pagar por samples irreconhecíveis por um humano. Se for por essa lógica, deveria ter direito autoral pros instrumentos. Pagar pra Yamaha, Korg etc em toda música”. Teria nascido o hip hop se todos os samplers usados fossem identificados, controlados e restringidos? Quantos novos gêneros musicais, estilos literários, expressões artísticas podem deixar de surgir se houver barreiras econômicas como essa?
Diante disso, entre dúvidas sobre como regular processos tecnológicos ainda em pleno desenvolvimento, parece ser importante a discussão sobre o uso justo. Sua manutenção enquanto abertura para exceções no direito autoral pode continuar permitindo que criadores e inventores possam recombinar conhecimentos existentes para criar novas possibilidades, como faziam antes com a câmera e o sampler. Por outro lado, quais as consequências para o colonialismo de dados se seguir a interpretação como uso justo da mineração de milhares de textos e dados necessários para que estes sistemas, hoje privados e fechados, de Inteligência Artificial funcionem?
Será que o copyleft poderia ser novamente evocado para equilibrar a discussão, garantindo por exemplo que obras geradas por Inteligência Artificial (a partir de prompts humanos) fossem licenciadas de forma aberta apenas para determinados usos? Seria tecnicamente possível o licenciamento e o controle em copyleft, dado a dificuldade entre diferenciar o que é cópia e original nesse contexto e o número cada vez mais massivo de obras geradas?
Poderíamos ainda abrir a questão para perguntar, se, de fato, a obra de arte é fruto apenas do espírito humano, como levanto ao final do “A Cultura é Livre”. Se não for, teria chegado a hora de, como os indígenas fazem a muito tempo, rever o antropocentrismo, dando status de criadores a seres não-humanos, “artificiais” ou “naturais”? As muitas perguntas sem resposta só endossam o desafio que a popularização das IAs generativas nos coloca para pensar como será o futuro da criação e da cultura livre.
* Leonardo Foletto é autor do livro A Cultura é Livre, jornalista, doutor em Comunicação (UFRGS), com pós-doutorado no LabCidade (FAU-USP). Pesquisador e professor na FGV ECMI e integrante do Creative Commons Brasil, edita o BaixaCultura desde 2008.
O texto foi republicado na Jacobin Brasil e no Outras Palavras; confira! |