x5p2qoem.png
Uma cena criada por Sora. (Imagem: OpenAI)

Sora é o novo modelo de IA generativa da OpenAI, que funciona de forma semelhante ao gerador de imagens Dall-E da mesma empresa. Os usuários simplesmente solicitam conteúdo de vídeo e o Sora retorna um videoclipe de alta qualidade. Ele também pode criar vídeos a partir de imagens estáticas, esticar vídeos ou preencher quadros vazios.

O vídeo pode ser a próxima fronteira da IA ​​generativa, com a chegada de chatbots e geradores de imagens ao mundo real. Embora bem recebida pelos entusiastas da IA, a nova tecnologia também levanta sérias preocupações sobre desinformação à medida que se aproximam as principais eleições políticas globais. De acordo com dados da empresa de aprendizado de máquina Clarity, o número de deepfakes gerados por IA aumentou 900% ano a ano.

Com o Sora, a OpenAI busca competir com ferramentas de IA para geração de vídeos de rivais como Meta, Google e startups como a Stability AI. A Amazon também lançou o Create with Alexa, um modelo baseado em prompts para gerar conteúdo animado de curta duração para crianças.

O Sora só consegue criar vídeos com um minuto ou menos de duração, e um pequeno grupo — ou "equipe vermelha" — tem usado o modelo para procurar vulnerabilidades de segurança. A OpenAI não lançou nenhuma demonstração pública além dos 10 clipes de amostra disponíveis em seu site.

A OpenAI também está desenvolvendo um classificador que pode identificar videoclipes como produtos Sora e planeja incluir certos metadados na saída para ajudar a identificar conteúdo gerado por IA. Esse esforço é semelhante ao que a Meta está fazendo para identificar imagens geradas por IA.

O Sora, assim como o ChatGPT, usa a arquitetura Transformer introduzida por pesquisadores do Google em um artigo de 2017.

(De acordo com a CNBC)