A nova tecnologia de IA do Google poderia ser mais inteligente do que o GPT-4 da OpenAI

A nova IA do Google pode ser mais esperta que o GPT-4 da OpenAI!

  • Google apresentou o Gemini, seu rival para o GPT-4 da OpenAI, nesta semana.
  • O Gemini supera o GPT-4 em matemática, programação e conhecimento de assuntos em seu nível mais avançado, segundo o Google.
  • O Google também afirma que é o primeiro modelo a superar especialistas humanos em um teste com 57 áreas de conhecimento.

Nesta semana, o Google apresentou o Gemini, que já se mostra como um rival assustadoramente inteligente para o GPT-4 da OpenAI.

O Gemini é composto por três modelos diferentes que variam em tamanho e capacidade. Seu modelo mais avançado, o Gemini Ultra – que ainda não está disponível ao público, mas o Google afirma ter sido projetado para “tarefas altamente complexas” – supera o GPT-4 em várias áreas, desde conhecimento de assuntos como história e direito até geração de código em Python e tarefas que exigem raciocínio de vários passos, informou o Google em seu anúncio.

O Google afirmou que o Gemini superou o GPT-4 no teste de Compreensão de Linguagem Multitarefa em Massa, ou MMLU, que é um dos métodos mais populares para avaliar o conhecimento e as habilidades de resolução de problemas de modelos de IA.

Você poderia compará-lo aos “SATs para modelos de IA”, disse Kevin Roose em um podcast de tecnologia do The New York Times. No entanto, o MMLU é um pouco mais avançado do que um típico exame preparatório para a faculdade. Ele abrange 57 disciplinas, incluindo matemática, física, história, direito, medicina e ética, para testar tanto o conhecimento global quanto as habilidades de resolução de problemas, de acordo com o anúncio do Google.

O Gemini Ultra obteve uma pontuação de 90% no MMLU, enquanto o GPT-4 obteve 86,4%, de acordo com o Google.

Mas a conquista mais impressionante do Gemini Ultra pode ser o fato de ser o primeiro modelo a superar especialistas humanos no MMLU. Especialistas humanos obtiveram cerca de 89,8% de acerto, segundo o Google em um relatório técnico sobre o Gemini.

“Acredito que se você voltar dois ou três anos atrás e disser aos pesquisadores de IA que o Google terá um modelo que alcança 90% no MMLU, melhor do que o limite de referência para especialistas humanos, eles teriam dito, bem, isso é AGI”, disse Roose. AGI, ou inteligência artificial geral, é uma forma hipotética de IA que pode processar capacidades humanas complexas, como senso comum e consciência. O GPT-4 realmente superou o Gemini Ultra por alguns pontos percentuais em uma avaliação das habilidades de raciocínio senso comum para tarefas cotidianas, segundo o Google.

Mas uma vantagem que o Google diz que o Gemini tem em relação a outros modelos é que ele é nativamente multimodal, o que significa que foi projetado desde o início para processar vários tipos de dados, desde texto até áudio, código, imagens e vídeo. Outros modelos multimodais foram criados através de uma “costura” de modelos apenas de texto, apenas de visão e apenas de áudio de uma forma “subótima”, afirmou Oriol Vinyals, vice-presidente de Pesquisa do DeepMind do Google, em um vídeo de apresentação do Gemini.

Como resultado, o Google diz que o design do Gemini permite que ele compreenda melhor as entradas do que os modelos multimodais existentes. Os pesquisadores por trás do blog SemiAnalysis também afirmam que o Gemini provavelmente “destruirá” o GPT-4 em termos de poder computacional. 

Embora o Gemini Ultra tenha estabelecido expectativas elevadas para a sua chegada, ainda não se sabe como o trio de modelos Gemini se sairá contra a OpenAI, que já tem uma vantagem em termos de conhecimento do consumidor.

As primeiras reações ao Gemini Pro de menor avanço, acessível através do chatbot Bard do Google, foram positivas. No entanto, o modelo também teve problemas de precisão e alucinações. Ele até mesmo indicou às pessoas que buscassem no Google respostas para perguntas controversas. 

O Google e a OpenAI não responderam a um pedido de comentário do Business Insider.