Vice-presidente do Google, Sissie Hsiao o vídeo de demonstração do Gemini AI ‘é totalmente real’, embora o Google ‘tenha encurtado algumas partes para objetividade

Vice-presidente do Google confirma a autenticidade do vídeo de demonstração do Gemini AI, mas admite que houve cortes para objetividade

No vídeo de demonstração lançado pela Google, o modelo de IA apresentado mostra suas capacidades multimodais, demonstrando habilidade em decifrar e lidar com informações obtidas de vídeos e áudios ao vivo. É uma conquista formidável para a Google, especialmente em uma arena competitiva, como a OpenAI, onde ficou para trás. Porém, de acordo com a Bloomberg, conforme reportado, a demonstração no vídeo foi criada “usando quadros de imagens estáticas do vídeo, com interação por texto”, ao invés de processamento em tempo real, vocal e de vídeo, como parecia ter alcançado.

No palco da conferência Brainstorm AI da ANBLE em San Francisco, na segunda-feira, a vice-presidente e gerente geral do Google Assistant, Sissie Hsiao, falou sobre a polêmica no vídeo de demonstração, focando nos benchmarks alcançados pelo modelo Gemini e como ele impulsionará o chatbot Bard da Google.

“O vídeo é completamente real. Todas as perguntas e respostas do modelo são reais”, disse Hsiao. “Nós encurtamos algumas partes por questão de brevidade, e isso foi mencionado no vídeo como informação sobre a produção do mesmo”, observou.

O vídeo de demonstração exibe as capacidades multimodais do novo modelo de IA, identificando uma linha sinuosa e, em seguida, as curvas de novas linhas, culminando na criação de um desenho de um pato. Ao longo desse processo, o modelo reconhece consistentemente cada elemento, oferecendo fatos e respostas relacionados ao pato em tempo real.

Hsiao destacou as conquistas alcançadas pelo Gemini, exibindo suas habilidades em benchmarks que desafiam modelos de IA, abrangendo física do ensino médio, dilemas legais profissionais e cenários morais. De acordo com the Verge, o Gemini Ultra venceu o GPT-4 da OpenAI em 30 de 32 benchmarks – uma conquista que vale a pena comemorar, apesar de o Gemini Ultra não ser lançado até o próximo ano. Por enquanto, o Bard utiliza o Gemini Pro, que é aproximadamente equivalente ao GPT 3.5.

Hsiao afirmou que esses modelos Gemini continuarão a melhorar a busca no Google, bem como o chatbot Google Bard, que, segundo ela, é “o chatbot gratuito mais preferido atualmente no mercado”.