George R.R. Martin, Jodi Picoult e outros autores de destaque enfrentam a OpenAI

Autores como George R.R. Martin e Jodi Picoult enfrentam a OpenAI.

Como aconteceu com processos anteriores nessa linha, a questão central é a alegação de que a Big AI treina seus sistemas em material pirateado e protegido por direitos autorais. A apresentação acusa a OpenAI de contornar completamente a “Lei de Direitos Autorais” para publicar seu empreendimento comercial lucrativo, pegando conjuntos de dados de livros relativamente recentes sem autorização.

Eu particularmente gostei dessa parte, que se baseia nas recentes declarações do CEO da OpenAI, Sam Altman, no Capitólio: “Altman disse ao Congresso que compartilha das preocupações dos Demandantes. De acordo com Altman, ‘garantir que a economia dos criadores continue vibrante é uma prioridade importante para a OpenAI… A OpenAI não deseja substituir os criadores. Queremos que nossos sistemas sejam usados para capacitar a criatividade e apoiar e aprimorar a humanidade essencial de artistas e criadores’. Altman depôs que a OpenAI ‘acredita que os criadores merecem controle sobre como suas criações são usadas’ e que ‘os criadores de conteúdo, os proprietários de conteúdo, precisam se beneficiar dessa tecnologia'”.

Há controle e há controle. Para a versão do controlador, aqui está Franzen sobre as demandas dos autores: “Os autores devem ter o direito de decidir quando suas obras são usadas para ‘treinar’ a IA. Se optarem por participar, devem ser devidamente compensados”.

Conforme escrevi no mês passado sobre a contribuição do Google para uma consulta australiana sobre regulação de IA, as empresas de tecnologia não desejam sistemas de adesão voluntária – elas querem que os criadores tenham que optar por não ter suas obras usadas como material de treinamento para modelos de linguagem em larga escala (LLM).

Isso é problemático, não apenas porque coloca a responsabilidade sobre o criador de proteger suas obras contra exploração indesejada. Para um exemplo do porquê, vamos dar uma olhada no formulário de “adesão voluntária para artistas e proprietários de conteúdo criativo” que a OpenAI acaba de publicar em conjunto com o lançamento de seu gerador de imagens DALL-E 3 (que apresenta imagens de alta qualidade, mãos mais plausíveis e prompts com a ajuda do ChatGPT – desculpe, “engenheiros de prompt” – e que será integrado ao Bing Chat da Microsoft).

Além de dizer aos artistas que eles podem ajustar seus sites para impedir o rastreamento da web do GPTBot da OpenAI, o formulário promete que aqueles que o enviarem terão suas imagens removidas “de conjuntos de dados de treinamento futuros”. Quanto aos modelos que já estão disponíveis, esse navio já zarpou – não é possível fazer com que um LLM “desaprenda” algo, mesmo que a OpenAI insista, em seu formulário, que os modelos “não têm mais acesso aos dados” após o treinamento.

O Authors Guild observa que o GPT da OpenAI já está sendo usado para gerar livros que imitam o trabalho de autores humanos, como a tentativa recente de gerar os volumes 6 e 7 da série “A Song of Ice and Fire” do autor George R.R. Martin, bem como os numerosos livros gerados por IA que foram publicados na Amazon, tentando se passar por obras geradas por humanos e buscando lucrar com a reputação conquistada com muito esforço por um autor humano.

A capacidade de dizer à OpenAI para se manter afastada no futuro não irá alterar essa situação. E, a propósito, a impossibilidade de alterar retrospectivamente o conjunto de dados de treinamento passado de um LLM pode se tornar um grande problema para empresas de IA em áreas além dos direitos autorais.

O TechCrunch relata que a autoridade de privacidade polonesa decidiu lançar uma investigação contra a OpenAI, após uma reclamação de conformidade com o Regulamento Geral de Proteção de Dados do pesquisador de privacidade e segurança Lukasz Olejnik. A lei da UE dá às pessoas o direito de exigir que as empresas corrijam informações pessoais incorretas sobre elas. Olejnik encontrou imprecisões em uma biografia gerada pelo ChatGPT sobre si mesmo, o que pode ser comum quando se trata de genAI, mas na UE Olejnik tem o direito de solicitar a retificação – e, quando o fez, a OpenAI disse que isso era impossível.

Tudo se resume a controle. E se a OpenAI não puder permitir que as pessoas exerçam o controle concedido a elas pela lei, estará em apuros. Mais notícias abaixo.

Quer enviar pensamentos ou sugestões para o Data Sheet? Envie uma mensagem aqui.

David Meyer

NOTÍCIAS DE DESTAQUE

Cisco compra a Splunk. A gigante de redes Cisco desembolsará US$ 28 bilhões para comprar a empresa de cibersegurança com o pior nome da história. Como ANBLE relata, o anúncio do acordo impulsionou o preço das ações da Splunk em 23% e reduziu o da Cisco em 5%. Do anúncio: “Juntas, Cisco e Splunk se tornarão uma das maiores empresas de software do mundo e acelerarão a transformação dos negócios da Cisco para uma receita mais recorrente.”

Discussão entre Google e Broadcom. Executivos do Google estão seriamente discutindo abandonar a Broadcom como parceira de design para seus chips de inteligência artificial, de acordo com The Information. O Google está supostamente irritado com o quanto a Broadcom está cobrando pelos “tensor processing units” e pode trazer o processo de design para dentro de casa. O relatório fez com que o preço das ações da Broadcom caísse 6%. (Leitura bônus: Continuando com o silício, leia o artigo do Wall Street Journal sobre a incapacidade da Apple de parar de usar os modems da Qualcomm.)

Macacos de Musk. Um relatório da Wired sugere que Elon Musk não estava sendo sincero quando afirmou que os macacos que morreram durante os testes de implante cerebral da Neuralink não morreram por causa dos próprios implantes (ele disse que estavam em estado terminal). Registros veterinários da UC Davis mostram que algumas das mortes foram realmente resultado desses implantes, e os detalhes não são agradáveis de ler. A Neuralink está prestes a começar a recrutar seres humanos como cobaias.

EM NOSSO FEED

“Eu acredito que muitos de nossos concorrentes aprenderão com nossas inovações em smartphones e eu os encorajo a fazer isso.”

William Li, CEO da montadora chinesa Nio, elogia o lançamento do primeiro smartphone da empresa. O Nio Phone é especificamente para motoristas da Nio e pode ser usado para instruir os veículos elétricos da empresa a se dirigirem até a localização do usuário, o que é permitido em alguns lugares na China. Ele possui mais de 30 funções específicas para carros.

CASO VOCÊ TENHA PERDIDO

Elon Musk está tentando conseguir a ajuda de Taylor Swift para aumentar o tráfego em sua plataforma X, por Christiaan Hetzner

Os “Zooglers” do Google podem estar elevando os custos de moradia em um centro europeu mais do que Londres e Nova York, por Ryan Hogg

CEO da Indeed: ‘A IA está mudando a forma como encontramos empregos e como trabalhamos. Pessoas como eu não devem ser as únicas a tomar decisões que afetam milhões de pessoas’, por Chris Hyams

Cathie Wood evitou a agitação do IPO da Arm porque havia ‘muito ênfase em IA’, por Chloe Taylor

‘Após cuidadosa consideração’, a Amazon cancela uma taxa extra de 2% para alguns comerciantes, enquanto reguladores planejam um processo antitruste, por Bloomberg

Um homem supostamente caiu de uma ponte desabada por causa do Google Maps. Agora sua família está processando a empresa por sua morte por afogamento, por Associated Press

ANTES DE PARTIR

Influenciadores deepfake. A MIT Technology Review tem um artigo fascinante sobre como marcas menores da China estão abordando o elemento essencial das transmissões ao vivo no comércio eletrônico, usando apresentadores gerados por IA para apresentar produtos e ofertas 24 horas por dia, 7 dias por semana. Aparentemente, as empresas precisam pagar apenas cerca de $1.100 e fornecer apenas alguns minutos de vídeo de amostra para obter um apresentador clonado com um ano de manutenção incluída.

Do artigo: “Enquanto os roteiros eram escritos previamente por humanos, agora as empresas estão usando grandes modelos de linguagem para gerá-los também. Agora, tudo o que os trabalhadores humanos precisam fazer é inserir informações básicas, como o nome e o preço do produto sendo vendido, revisar o roteiro gerado e assistir ao influenciador digital entrar ao vivo.”