O ChatGPT se conecta novamente à fonte de dados em tempo real da internet

O ChatGPT reconecta à fonte de dados em tempo real da internet

Para a grande história de hoje, voltamos ao ChatGPT. A OpenAI anunciou na semana passada que seu chatbot agora pode navegar na internet em tempo real. E embora a atualização nem mesmo tenha gerado um post no blog da empresa (a notícia foi anunciada no LinkedIn e no Twitter), é significativa tanto para o funcionamento do ChatGPT quanto para o futuro da pesquisa.

A nova capacidade, chamada de “Navegar com o Bing”, significa que o ChatGPT não está limitado aos dados anteriores a setembro de 2021, quando seus dados de treinamento foram interrompidos. Atualmente, está disponível apenas para clientes Pro e Enterprise, mas a OpenAI diz que expandirá para todos os usuários “em breve”.

Esta é na verdade a segunda tentativa da OpenAI de lançar a navegação ao vivo para o ChatGPT. A empresa lançou a funcionalidade em junho, mas a retirou rapidamente, alegando que estava contornando paywalls e configurações de privacidade. Já existem outras maneiras para os usuários do GPT aproveitarem o conhecimento atual da web, como o uso de extensões de terceiros ou o Bing Chat, que é alimentado pelo GPT-4. Mas a integração em larga escala da navegação ao vivo no ChatGPT marca um ponto de virada para a ferramenta, à medida que continua liderando o crescente desfile de chatbots e assistentes de IA.

Também impulsiona a conversa sobre o papel que a IA generativa terá na pesquisa. É crucial destacar que o ChatGPT Navegar com o Bing fornecerá links para citar de onde encontrou as informações que apresenta, mas ainda há motivos para ser cético em relação à precisão dos fatos. O problema de “alucinação” da IA generativa, em que essas ferramentas inventam informações e as apresentam como fatos, continua a se espalhar. E embora citar fontes pareça ser a maneira mais segura de garantir a precisão (é assim que os escritores humanos respaldam seus trabalhos, afinal), já vimos que as ferramentas de IA generativa não são tão boas nisso. Na semana passada, por exemplo, falamos sobre os experimentos malsucedidos do colunista do New York Times, Kevin Roose, usando o Bard do Google por e-mail, em que a ferramenta de IA generativa atribuiu repetidamente informações de maneira incorreta, além de distorcer e inventar informações. E isso se limitou ao que estava na caixa de entrada de Roose, nem mesmo a web como um todo.

É uma coisa colocar informações no ChatGPT e pedir para resumir, criar tópicos ou realizar outras tarefas com as informações fornecidas. Mas quando se trata de trazer conteúdo externo, está claro que os usuários ainda precisarão verificar cada informação e sua fonte se quiserem alcançar qualquer nível de certeza de que o que o ChatGPT disse é verdadeiro. Parece ser muito trabalho. E isso levanta a questão: isso é realmente uma maneira melhor de pesquisar? Ou, se ainda não é, será no futuro?

Essas perguntas também se aplicam ao Bard, que também pode acessar a web. Mas, curiosamente, são as mesmas perguntas que as pessoas têm feito cada vez mais sobre um tipo totalmente diferente de plataforma, o TikTok. Embora a ideia de que o TikTok é melhor para pesquisa do que o Google tenha sido inicialmente apresentada como uma preferência da geração Z (e de fato uma pesquisa sugere que 51% das mulheres da geração Z preferem o aplicativo ao Google para pesquisa), todos os tipos de usuários, profissionais de marketing e até mesmo editores de tecnologia estão agora explorando seriamente a possibilidade. E é fácil entender o porquê: as páginas de pesquisa do Google hoje estão cheias de tantos anúncios e conteúdo criado para SEO que obter as informações desejadas requer navegar por uma infinidade aparentemente interminável de assuntos irrelevantes.

O TikTok, no entanto, se beneficia do formato de vídeo curto claramente bem-sucedido, onde qualquer pergunta provavelmente será respondida diretamente e por um rosto amigável entregando-a com personalidade, possivelmente até com uma música de sucesso tocando ao fundo. E o ChatGPT oferece uma interface super simples e uma experiência de conversa, sem mencionar uma série de recursos adicionais.

Mas o TikTok tem o mesmo problema que o ChatGPT, que é a necessidade de voltar ao Google para verificar os fatos do que acabou de aprender. Os criadores do TikTok podem fornecer respostas de maneiras mais cativantes, e há pessoas respeitáveis compartilhando informações precisas na plataforma, mas também há muita desinformação. E de forma interessante, o TikTok confirmou recentemente que está testando a exibição de resultados do Google em suas páginas de pesquisa, mostrando como a plataforma está realmente se inclinando para a pesquisa (e como o Google pode ter um futuro conectando sua pesquisa a outras plataformas).

Tudo isso para dizer que, embora plataformas como TikTok, ChatGPT e Bard ainda tenham um longo caminho a percorrer em termos de precisão e confiança antes de poderem derrubar o clássico Google, elas estão claramente empurrando os limites da pesquisa. O Google ainda detém mais de 90% do mercado de mecanismos de pesquisa (como lamentou o CEO da Microsoft, Satya Nadella, em um tribunal na segunda-feira), mas com interfaces melhores começando a chamar a atenção dos usuários, está se tornando possível imaginar um mundo em que o Google, como o conhecemos, se torne um complemento ou recurso de referência, em vez de ser o padrão global para todas as perguntas.

E com isso, aqui está o restante das notícias de IA desta semana.


Mas antes… um lembrete: A ANBLE está organizando um evento online no próximo mês chamado “Capturando os Benefícios da IA: Como Equilibrar Risco e Oportunidade”.

Nesta conversa virtual, parte do Brainstorm AI da ANBLE, discutiremos os riscos e danos potenciais da IA, centrando a conversa em torno de como os líderes podem mitigar os efeitos negativos potenciais da tecnologia, permitindo-lhes capturar os benefícios com confiança. O evento acontecerá em 5 de outubro às 11h (horário de Brasília). Registre-se para a discussão aqui.

Sage Lazzaro[email protected]

IA NAS NOTÍCIAS

Google adiciona ferramenta para editores optarem por não terem seus dados raspados para treinamento de IA. A empresa anunciou o Google-Extended, no qual os editores poderão ativar ou desativar a opção de impedir que os rastreadores de dados do Google ofereçam seu conteúdo como dados de treinamento para as tecnologias de IA do Google. A empresa confirmou em julho que usa dados públicos da web para alimentar seus serviços de IA como Bard.

Meta admite que postagens do Facebook e Instagram foram usadas para treinar novo assistente de IA. Isso é o que afirma a ANBLE, que relata que a empresa não utilizou mensagens privadas ou postagens privadas compartilhadas apenas com familiares e amigos. “Tentamos excluir conjuntos de dados que têm uma grande quantidade de informações pessoais”, disse Nick Clegg, presidente de assuntos globais da Meta. Será que a Meta fornecerá uma opção de exclusão?

Oficiais do Reino Unido negociam acesso para examinar o funcionamento interno de modelos de IA da OpenAI, Anthropic e Google DeepMind. Isso é o que afirma o Financial Times. As empresas concordaram em abrir seus modelos para fins de pesquisa de segurança governamental no início de junho, mas a extensão do acesso nunca foi acordada. À medida que as demandas por transparência continuam, os oficiais do Reino Unido esperam chegar a um acordo para examinar os modelos antes que o país sedie a primeira cúpula global sobre segurança em IA em novembro.

Autoridade de concorrência da França realiza busca no escritório francês da Nvidia em investigação antitruste no setor de nuvem. Isso é o que afirma o Wall Street Journal. A agência realizou a busca sob suspeita de que a fabricante de chips esteja envolvida em práticas anticompetitivas e que isso faça parte de uma investigação mais ampla sobre o setor de nuvem. Esta é a primeira ação regulatória significativa contra a Nvidia, que é amplamente considerada a única opção viável para o tipo de chip necessário para executar os modelos de IA mais recentes.

OLHO NA PESQUISA EM IA

Pesquisa de viés em IA. Estudos repetidamente revelaram vieses raciais em tecnologias de visão computacional e agora um novo artigo de pesquisadores da Sony AI e da Universidade de Tóquio revela vieses raciais adicionais. Ele também propõe uma solução para identificação e avaliação de vieses.

O artigo sugere que, embora o sistema de classificação de tipos de pele de Fitzpatrick para avaliar vieses de cor de pele em visão computacional seja eficaz, ele se concentra apenas no aspecto claro-escuro do tom de pele. Os pesquisadores argumentam que também é necessário levar em conta a tonalidade da pele – a variação do vermelho ao amarelo – e que, ao fazer isso, foram revelados vieses adicionais relacionados à cor da pele em conjuntos de dados e modelos de visão computacional. Leia o artigo completo aqui.

ANBLE SOBRE IA

Por que as startups de “copiloto de IA” estão tão em alta entre os investidores agora – Anne Sraders

Uma startup britânica de um ano diz ter alcançado uma grande avanço na segurança da IA ao obter alta pontuação em um videogame – Jeremy Kahn

O Google finalmente deu acesso a adolescentes à IA generativa na busca. Provavelmente eles já estavam usando mesmo – Rachyl Jones

O guru de cibersegurança de Harvard adverte que a IA é ‘especialmente adequada para propaganda na era da internet’ enquanto as eleições enfrentam campanhas de desinformação russa, chinesa e iraniana – Bruce Schneier e The Conversation

Como a IA generativa está colocando os CFOs na vanguarda da estratégia empresarial – Sheryl Estrada

A NSA inaugura centro de segurança de IA com foco na China e Rússia, enquanto general adverte que a liderança dos EUA ‘não deve ser considerada garantida’ – Associated Press

ALIMENTO PARA O CÉREBRO

Um dia na vida de um rotulador de dados. A rotulagem de dados, a tarefa tediosa de anotar dados com rótulos e contexto para que os modelos de aprendizado de máquina possam aprender com eles, está se tornando uma atividade extra no TikTok. Em um vídeo viral recente que combina o popular formato “Um Dia na Vida” com um desafio de 100 dias, uma pessoa chamada Jackie convida os espectadores a acompanharem sua jornada de desafiar-se a ganhar um extra de $100 por dia durante 100 dias fazendo trabalho de rotulagem de dados.

No vídeo, ela começa fazendo um café com leite (como é comum em vídeos “Um dia na vida”) e vai para o escritório para o seu trabalho em tempo integral. Ela faz uma parada no supermercado a caminho de casa, verifica o Swagbucks em busca de outras oportunidades de ganhar dinheiro online e, em seguida, começa a fazer anotações. Ela rotula os dados intermitentemente durante toda a noite, entre fazer o jantar e assar brownies – 34 minutos de trabalho por $15.58, mais uma hora por $25 e assim por diante, até que finalmente ela alcance $104,75 depois de 4 horas e 9 minutos de anotações. Os comentários estão cheios de pessoas pedindo conselhos sobre como começar a fazer o mesmo.

É uma colisão fascinante das questões de trabalho e inteligência artificial que estão surgindo na sociedade no momento. Aqui está uma jovem mulher trabalhando o dia todo em um emprego das nove às cinco, trabalhando quase todas as noites por apenas $100 (menos após os impostos) e embalando tudo isso para consumo na internet. O trabalho que ela está fazendo pode parecer simples e inofensivo, mas na verdade está impulsionando a maior transformação trabalhista da história humana (para melhor ou para pior). E também há o fato de que a grande maioria desse tipo de trabalho tem sido realizado por trabalhadores explorados recrutados de países pobres pelas maiores empresas do mundo e pagos tão pouco quanto $1,46 por hora pelo mesmo trabalho (ou, em muitos casos, anotando conteúdo que apresenta imagens explícitas de violência e abuso). Na semana passada, um grupo de legisladores dos EUA enviou uma carta para a Amazon, Google, OpenAI e outras gigantes de tecnologia exigindo que elas respondam perguntas sobre as condições de trabalho dos trabalhadores de dados.

Para deixar claro, nada disso é uma crítica ao autor do vídeo. Mas certamente é algo para se refletir.