À medida que o Google se aprofunda em IA, os editores enfrentam novos desafios

Enquanto o Google mergulha de cabeça em IA, os editores encaram desafios de outro mundo

NOVA YORK, 19 de outubro (ANBLE) – Você nunca mais precisará ler outra notícia em sua vida, se tiver inteligência artificial capaz de digerir todas as informações da web e fornecer um resumo sob demanda.

Essa é a coisa dos pesadelos para os magnatas da mídia, já que o Google (GOOGL.O) e outros experimentam o que é chamado de IA generativa, que cria novo conteúdo a partir de dados passados.

Desde maio, o Google começou a lançar uma nova forma de pesquisa com base na IA generativa, depois que observadores da indústria questionaram a importância futura da gigante da tecnologia em fornecer informações aos consumidores após o surgimento do chatbot do OpenAI, ChatGPT.

O produto, chamado de Search Generative Experience (SGE), usa IA para criar resumos em resposta a algumas consultas de pesquisa, acionados pela determinação do sistema do Google de que o formato seria útil. Esses resumos aparecem no topo da página inicial de pesquisa do Google, com links para “aprofundar”, de acordo com a visão geral do SGE pelo Google.

Se os editores quiserem impedir que seu conteúdo seja usado pela IA do Google para ajudar a gerar esses resumos, eles devem usar a mesma ferramenta que também os impediria de aparecer nos resultados de pesquisa do Google, tornando-os praticamente invisíveis na web.

Procurar por “Quem é Jon Fosse” – o recente vencedor do Prêmio Nobel de Literatura – por exemplo, gera três parágrafos sobre o escritor e seu trabalho. Botões suspensos fornecem links para o conteúdo de Fosse na Wikipedia, NPR, The New York Times e outros sites; links adicionais aparecem à direita do resumo.

O Google diz que os resumos gerados por IA são sintetizados a partir de várias páginas da web e que os links são projetados para serem um ponto de partida para aprender mais. Ele descreve o SGE como um experimento opcional para os usuários, a fim de ajudar a evolução e aprimoramento do produto, enquanto incorpora feedback de editores de notícias e outros.

Para os editores, a nova ferramenta de pesquisa é o último sinal vermelho em um relacionamento de décadas em que ambos lutaram para competir contra o Google na publicidade online e dependiam da gigante da tecnologia para o tráfego de pesquisa.

O produto em evolução – agora disponível nos Estados Unidos, Índia e Japão – tem levantado preocupações entre os editores, à medida que tentam descobrir seu lugar em um mundo em que a IA poderia dominar como os usuários encontram e pagam por informações, de acordo com quatro grandes editores que falaram com a ANBLE sob condição de anonimato para evitar complicar as negociações em curso com o Google.

Essas preocupações estão relacionadas ao tráfego na web, se os editores serão creditados como fonte de informações que aparecem nos resumos do SGE e a precisão desses resumos, afirmam esses editores. Mais significativamente, os editores desejam ser compensados pelo conteúdo em que o Google e outras empresas de IA treinam suas ferramentas de IA – um grande ponto de discórdia em relação à IA.

Um porta-voz do Google disse em comunicado: “Conforme incorporamos a IA generativa na Pesquisa, continuamos a priorizar abordagens que enviam tráfego valioso para uma ampla gama de criadores, incluindo editores de notícias, para apoiar uma web saudável e aberta.”

Em relação à compensação, o Google afirma estar trabalhando no desenvolvimento de uma melhor compreensão do modelo de negócios das aplicações de AI generativa e obter subsídios de editores e outros.

No final de setembro, o Google anunciou uma nova ferramenta, chamada Google Extended, que dá aos editores a opção de bloquear seu conteúdo para que não seja usado pelo Google para treinar seus modelos de IA.

Permitir que os editores optem por não serem rastreados pela IA é um “gesto de boa fé”, disse Danielle Coffey, presidente e diretora executiva da News Media Alliance, um grupo comercial da indústria que está fazendo lobby no Congresso sobre essas questões. “A questão é se os pagamentos seguirão em frente e até que ponto há abertura para ter uma troca de valor mais saudável.”

A nova ferramenta não permite que os editores bloqueiem seu conteúdo de ser rastreado para o SGE, nem os resumos nem os links que aparecem com eles, sem desaparecerem da pesquisa tradicional do Google.

Os editores desejam cliques para garantir anunciantes e aparecer na pesquisa do Google é fundamental para o seu negócio. O design do SGE empurrou ainda mais para baixo da página os links que aparecem na pesquisa tradicional, com potencial para reduzir o tráfego nesses links em até 40%, de acordo com um executivo em um dos editores.

Ainda mais preocupante é a possibilidade de que os navegadores da web evitem clicar em qualquer um dos links se a passagem do SGE satisfizer a necessidade dos usuários de obter informações – satisfeito, por exemplo, em saber a melhor época do ano para ir a Paris, sem precisar clicar em um site de publicação de viagens.

Segundo o analista sênior da Forrester Research, Nikhil Lai, o SGE “definitivamente vai reduzir o tráfego orgânico dos editoras e eles terão que pensar em uma maneira diferente de medir o valor desse conteúdo, se não for através da taxa de cliques”. Mesmo assim, ele acredita que a reputação dos editores permanecerá forte como resultado de seus links aparecerem no SGE.

O Google afirma que projetou o SGE para destacar o conteúdo da web. “Quaisquer estimativas sobre impactos específicos no tráfego são especulativas e não representativas, pois o que você vê hoje no SGE pode parecer bastante diferente do que será lançado de forma mais abrangente na Pesquisa”, disse um porta-voz da empresa em comunicado.

Embora os editores e outras indústrias tenham passado décadas ajustando seus sites para aparecerem proeminentemente na pesquisa tradicional do Google, eles não têm informações suficientes para fazer o mesmo para os novos resumos do SGE, afirmam esses editores.

“A nova seção de IA é uma caixa-preta para nós”, disse um executivo de um editor. “Não sabemos como garantir que façamos parte dela ou qual é o algoritmo por trás disso”.

O Google afirmou que os editores não precisam fazer nada diferente do que têm feito para aparecer na pesquisa.

Os editores permitiram que o Google “rastreasse” seu conteúdo para fins de aparecer nos resultados da pesquisa – usando um robô, ou programa de software, para digitalizá-lo e indexá-lo automaticamente. “Rastrear” é como o Google indexa a web para fazer o conteúdo aparecer na pesquisa.

As preocupações dos editores com o SGE se resumem a um ponto-chave: eles afirmam que o Google está rastreando seu conteúdo, gratuitamente, para criar resumos que os usuários podem ler em vez de clicar em seus links, e que o Google não deixou claro como eles podem bloquear o conteúdo para que não seja rastreado pelo SGE.

Um editor afirmou que a nova ferramenta de pesquisa do Google “é ainda mais ameaçadora para nós e para o nosso negócio do que um rastreador que está percorrendo ilegalmente o nosso negócio”.

O Google não comentou essa avaliação.

Quando têm a opção, os sites estão bloqueando seu conteúdo para uso pela IA, desde que isso não afete a pesquisa, de acordo com dados exclusivos do detector de conteúdo de IA Originality.ai. Desde o lançamento em 7 de agosto, 27,4% dos principais sites estão bloqueando o robô ChatGPT, incluindo o The New York Times e o Washington Post. Isso se compara a 6% que estão bloqueando o Google-Extended desde o lançamento em 28 de setembro.