A China dá um salto à frente na corrida armamentista de inteligência artificial, à medida que a Alibaba lança um novo chatbot que pode ‘ler’ imagens.

A China avança na corrida da inteligência artificial com a Alibaba lançando um chatbot capaz de ler imagens.

Os modelos de código aberto, chamados Qwen-VL e Qwen-VL-Chat, são modelos de linguagem de visão, o que significa que eles “leem” imagens em vez de texto, ao contrário dos concorrentes Chat-GPT e Google Bard. Qwen-VL-Chat promete recursos complexos, como fornecer direções através da leitura de placas de rua, resolver equações matemáticas com base em uma foto e tecer uma narrativa com base em várias imagens. Por exemplo, ele pode ler uma imagem de uma placa em um hospital escrita em mandarim e traduzi-la para o inglês, ou ajudar uma organização de notícias a escrever uma legenda para uma foto, diz a empresa.

O Qwen-VL, o outro lançamento de sexta-feira, é uma versão atualizada de seu chatbot de leitura de imagens existente, que agora pode ler imagens em alta resolução.

O Alibaba se recusou a comentar além do seu anúncio público.

Essas novas iterações de A.I. são os mais recentes tiros disparados na corrida armamentista entre os desenvolvedores para criar ferramentas cada vez mais sofisticadas, à medida que a tecnologia passa de um truque para um verdadeiro transformador de jogos. Por exemplo, o Alibaba afirma que sua nova tecnologia de leitura de imagens oferece oportunidades significativas para ajudar pessoas com deficiência visual nas compras, permitindo que elas, por exemplo, escaneiem um item e tenham o chatbot recitando o rótulo de volta para eles.

Ambos os modelos estarão disponíveis na plataforma de modelo como serviço Modelscope da Alibaba Cloud e na Hugging Face, a popular startup que possui uma biblioteca de modelos de A.I.

O lançamento do Alibaba ocorre apenas um dia depois que a Meta lançou um modelo de A.I. ajustado para escrever código, construído no modelo Llama 2 de código aberto lançado em julho. O Alibaba vem tentando acompanhar os lançamentos de A.I. da Meta nos últimos meses. No início deste mês, o Alibaba revelou seus dois primeiros modelos de linguagem de código aberto, Qwen-7B e Qwen-7B-Chat, os mesmos que servem de base para os lançamentos de sexta-feira. Em julho, as duas empresas firmaram um acordo para disponibilizar o modelo Llama 2 da Meta no mercado chinês por meio da divisão de nuvem do Alibaba.

Ao disponibilizar esses novos modelos como código aberto, o Alibaba permite que os usuários ajustem as ferramentas para desenvolver seus próprios aplicativos ou realizar pesquisas. A maioria das empresas de A.I. espera que os usuários adaptem modelos de código aberto em ferramentas para casos de uso altamente específicos, sem precisar construir um grande modelo de linguagem do zero. Ao lado das ofertas de código aberto, as empresas oferecem seus modelos proprietários como um serviço, esperando capturar participação de mercado na indústria em expansão.

O desenvolvimento de A.I. é uma prioridade para o governo chinês

No mês passado, o governo chinês se tornou um dos primeiros países a emitir regulamentações abrangentes para A.I., um desenvolvimento que os especialistas dizem ter dado sinal verde para que o Alibaba e outras empresas de tecnologia chinesas tornem seus produtos públicos.

O Alibaba também está se preparando para passar por uma reestruturação completa que separaria o Alibaba Cloud, a divisão de computação em nuvem que abriga sua pesquisa de A.I., em uma divisão independente, uma mudança que os investidores recebem com satisfação. Como a tecnologia de A.I. requer uma capacidade computacional significativa que só pode ser devidamente atendida com uma rede em nuvem, ter as duas na mesma divisão impulsionaria a eficiência da A.I. O atual CEO e presidente do Alibaba Cloud, Daniel Zhang, está programado para deixar o cargo em setembro, sendo substituído por dois dos cofundadores do Alibaba: Eddie Wu como CEO e Joseph Tsai como presidente.

O governo chinês indicou em mais de uma ocasião que considera a A.I. fundamental para seu futuro tecnológico, criando uma corrida armamentista com os EUA. Até ferramentas aparentemente inofensivas, como aquelas lançadas pelo Alibaba na sexta-feira, podem ser implicadas devido à sua tecnologia subjacente e à forma como outros desenvolvedores podem usá-las. A A.I. “se tornou um proxy na batalha pela primazia entre China e EUA”, disse Kerry Brown, diretor do Lau China Institute da King’s College London, à ANBLE no início deste mês.

Até agora, parece que as empresas de tecnologia chinesas estão um pouco atrás de suas contrapartes dos EUA. A versão de código aberto do modelo Llama 2 da Meta é baseada em cerca de 70 bilhões de variáveis (chamadas parâmetros na linguagem da A.I.), cerca de 10 vezes maior do que os novos lançamentos do Alibaba (o Alibaba diz ter modelos maiores que não são de código aberto.) Apesar da vantagem dos EUA, autoridades governamentais estão preocupadas que o governo chinês acabe cooptando tecnologia de A.I. desenvolvida por empresas privadas para fins militares ou de vigilância, segundo o Axios.