Meta apresenta a sua inteligência artificial generativa de vídeo

A Meta apresentou na sexta-feira a sua nova interface generativa de inteligência artificial (IA) Movie Gen, que permite criar vídeos com som a partir de texto ou imagens, seguindo os passos de outros pioneiros da IA.

O Movie Gen é o terceiro modelo de geração de imagens do Meta depois de uma primeira versão em julho de 2022 e uma segunda em novembro de 2023.

Nenhuma das três interfaces foi disponibilizada publicamente. São testados nesta fase por criadores e realizadores que avaliam o Movie Gen e ajudam a melhorar o 'software'.

PUB

Questionado pela agência France-Presse (AFP) sobre a data de colocação do Movie Gen 'online', a Meta, empresa-mãe das redes sociais Facebook, Instagram ou WhatsApp, não respondeu de imediato.

Além dos vídeos de demonstração, o grupo publicou na sexta-feira um artigo de investigação que descreve o seu modelo.

Os modelos de linguagem são 'softwares' baseados em enormes bases de dados, que permitem gerar conteúdo, texto, imagem, vídeo, som ou código de computador em resposta a um pedido formulado em linguagem quotidiana.

O Movie Gen pode produzir um vídeo a partir de um pedido escrito, mas também a partir de uma simples foto. Também oferece a funcionalidade de edição para um vídeo existente.

O modelo oferece ainda a adição de banda sonora ao vídeo, seguindo o mesmo princípio do pedido na linguagem quotidiana.

Na curta sequência publicada no site Meta, uma frase é suficiente para gerar o vídeo de um quadriciclo a conduzir no deserto com um som de motor a roncar e uma melodia de guitarra.

A Meta sugere que uma versão do Movie Gen poderá um dia ser utilizável através das suas redes sociais Instagram e Facebook, ou até mesmo através de mensagens WhatsApp.

O grupo apresenta como exemplo um vídeo que seria editado com instruções em linguagem quotidiana antes de ser publicado nas redes sociais.

A Meta não é a primeira empresa tecnológica de IA a desenvolver um modelo de geração de vídeo.

Runway, da start-up Runway AI, permite, a partir de um pedido escrito, criar um plano de poucos segundos, transformar uma série de imagens estáticas num pequeno vídeo, ou remodelar uma sequência existente para transformar, por exemplo, uma foto num uma pintura.

Em fevereiro, a OpenAI lançou também a sua versão, chamada Sora, enquanto a Google trabalha num modelo chamado Lumiere.

A Meta afirma que o Movie Gen "é superior aos modelos similares da indústria quando a sua produção é avaliada por humanos".