Hollywood não deveria rejeitar totalmente a inteligência artificial – ela já está proporcionando uma nova era de magia cinematográfica.

Hollywood não deve rejeitar a inteligência artificial - ela está trazendo uma nova era de magia cinematográfica.

Além de aumentar a produção criativa, para a indústria cinematográfica, aproveitar o poder da IA também se traduz em orçamentos mais baixos e tempo de pós-produção mais curto – uma grande vitória para os produtores de filmes, especialmente aqueles que lideram produções menores como Everything, Everywhere, All At Once.

O filme foi o grande vencedor da temporada de premiações deste ano, conquistando prêmios do SAG, BAFTA e Golden Globes, além de sete prêmios do Oscar, incluindo Melhor Filme, Melhor Diretor e Melhor Atriz. Enquanto o filme é considerado o precursor de uma nova era para Hollywood, que celebra a diversidade e a comunidade asiática, EEAAO também trouxe outra grande mudança para a indústria cinematográfica: o uso da IA para entregar efeitos visuais melhores e mais econômicos.

Enquanto os recentes avanços nos chatbots alimentados por IA têm causado furor na Internet, outro modelo de linguagem grande (LLM) está silenciosamente revolucionando a produção cinematográfica. Os modelos de difusão generativa estão desbloqueando poderosas ferramentas de criação e edição de imagens, aprimorando a criatividade dos artistas de efeitos visuais e oferecendo uma nova era de magia no cinema. Os modelos de difusão observam bilhões de imagens e aprendem vários elementos para produzir novas, estender uma imagem existente além de seus limites, transferir estilo e criar imagens completamente novas com base no texto encontrado nos metadados.

No caso do EEAAO, uma pequena equipe de artistas de efeitos visuais foi encarregada de criar um multiverso dentro de prazos apertados, levando-os a recorrer a ferramentas de IA para automatizar aspectos tediosos da edição. Os editores usaram uma popular suíte de “ferramentas mágicas” de IA da Runway, uma startup de criação de conteúdo de IA e uma das pesquisadoras por trás da Stable Diffusion, para criar um vídeo que teria sido muito caro e demorado para produzir em um set de filmagem ou como um efeito de CGI. Para uma cena específica, um artista de VFX usou uma ferramenta de rotoscopia para obter um corte rápido e limpo de rochas se movendo pela areia enquanto poeira girava ao redor do enquadramento. Dias de trabalho meticuloso foram reduzidos a meros minutos. O resultado? Magia cinematográfica de qualidade de Oscar.

Há uma onda de startups inovadoras no espaço ajudando cineastas a dar vida às suas visões de maneiras empolgantes. A Metaphysic utiliza a IA generativa para criar vídeos fotorrealistas e em breve será usada para ajudar Tom Hanks e Robin Wright a retratar personagens mais jovens por meio do rejuvenescimento com qualidade de alta fidelidade do que tentativas anteriores – mais Harrison Ford no último Indiana Jones do que Jeff Bridges na sequência de Tron alguns anos atrás. A Synthesia ajuda qualquer pessoa com um computador a criar vídeos profissionais (para treinamento corporativo, marketing de produtos e fins educacionais) com simples prompts de texto que cobrem 120 idiomas, sem a necessidade de um diploma em cinema.

A Krikey, uma startup liderada por uma dupla de irmãs, utiliza a IA generativa para facilitar a vida dos criadores ao dar vida às animações, ajudando-os a automatizar o movimento dos personagens. Uma das melhores coisas sobre essa ferramenta é que os artistas podem escolher criar um vídeo com avatares 3D personalizados fornecidos pela ferramenta (incluindo movimentos corporais e das mãos, expressões faciais, cenários em 3D e ângulos de câmera) ou exportar um arquivo de “animação de esqueleto” e aplicá-lo aos seus próprios personagens com alguns cliques. Isso garante que estúdios e empresas de jogos possam proteger sua propriedade intelectual, que nunca é compartilhada com a Krikey. A empresa também oferece um aplicativo “similar ao Canva”, que facilita a criação de filmes de animação com apenas alguns cliques – um alívio bem-vindo para produtores de vídeos corporativos e educacionais.

As possibilidades são infinitas. Composição, estilização, preenchimento, rastreamento de movimento, você nomeia – a IA pode tornar tudo mais fácil, rápido e indolor para os criadores, liberando-os para se concentrar em conceitos de ideias e entregar iterações mais rápidas. Imagens existentes de um trem saindo de uma estação podem ser transformadas em uma animação em massa de modelagem de argila. Imagens de um homem correndo na neve podem ser recompostas para parecer que ele está correndo na superfície de Marte. Imagens aéreas de uma cidade construída com Legos podem ser renderizadas para parecer uma cidade vibrante e real ao amanhecer. Uma modelo desfilando na passarela pode ter a cor real de seu cabelo mascarada para combinar com seu vestido. Tudo isso agora pode ser gerado em segundos, seguindo simples prompts de texto ou imagem e mantendo alta qualidade e flexibilidade.

À medida que mais modelos e ferramentas de refinamento chegam ao mercado e o interesse cresce, precisaremos de uma enorme capacidade de computação para sustentá-los e dimensioná-los – um uso exemplar do poder da nuvem. A primeira versão do Stable Diffusion começou com 100.000 GB de imagens e rótulos de treinamento para gerar uma imagem em apenas 5,6 segundos. Hoje, as novas versões reduziram esse tempo para 0,9 segundos e também adicionaram funcionalidades que aumentam a resolução da imagem e inferem informações de profundidade.

Podemos todos nos alegrar com o triunfo do EEAAO, o primeiro grande sucesso para a I.A. À medida que mais estúdios, editores e artistas adotam ferramentas de I.A., estas serão democratizadas e ajudarão a desbloquear o potencial de cineastas amadores em todo o mundo. Uma coisa é certa: aqueles vídeos de gatos que a Internet tanto ama estão prestes a se tornar muito mais interessantes.

Howard Wright é o Vice-Presidente e Diretor Global de Startups na AWS.

As opiniões expressas nos artigos de comentários da ANBLE.com são exclusivamente as opiniões de seus autores e não refletem necessariamente as opiniões e crenças da ANBLE.