OpenAI lança ferramenta de criação de vídeo baseada em texto

[anúncio_1]

De acordo com a CNBC , a OpenAI acaba de lançar o Sora — um modelo de IA de última geração que funciona de forma semelhante à sua ferramenta de IA de geração de imagens anterior, o DALL-E. Os usuários só precisam inserir a cena desejada e o Sora retornará um videoclipe de alta resolução. O Sora também pode criar videoclipes inspirados em imagens estáticas e expandir vídeos existentes ou preencher quadros ausentes.

OpenAI ra mắt công cụ sáng tạo video bằng văn bản- Ảnh 1. — Cães samoiedos e golden retrievers brincam em uma cidade com luzes de neon à noite em vídeo gerado por IA

A criação de vídeos pode ser o próximo grande passo para a IA criativa, depois que chatbots e geradores de imagens conquistaram espaço nos universos do consumidor e dos negócios há pouco tempo. Embora a criação de conteúdo entusiasme os entusiastas da IA, essas novas tecnologias estão levantando sérias preocupações sobre desinformação à medida que as principais eleições políticas globais se aproximam. De acordo com dados da empresa de aprendizado de máquina Clarity, o número de deepfakes gerados por IA aumentou 900% ano a ano.

Com o Sora, a OpenAI busca competir com ferramentas de IA para geração de vídeos de empresas como Google e Meta. Ferramentas de IA semelhantes estão disponíveis em outras startups, como a Stability AI, que tem um produto chamado Stable Video Diffusion. A Amazon também lançou o Create with Alexa, um modelo especializado na criação de conteúdo animado de curta duração para crianças com base em comandos.

Atualmente, o Sora está limitado a gerar vídeos de até um minuto de duração. A OpenAI tornou a multimodalidade, um método que combina geração de texto, imagem e vídeo, um objetivo em um esforço para fornecer um conjunto mais amplo de modelos de IA.

Até o momento, o Sora só foi disponibilizado para um pequeno grupo de testadores de segurança, ou "equipes vermelhas", encarregados de testar o modelo em busca de vulnerabilidades em áreas como desinformação. A empresa não divulgou nenhuma demonstração pública além dos 10 clipes de amostra disponíveis em seu site e afirma que a documentação técnica que a acompanha será divulgada em breve.

A OpenAI também afirma estar desenvolvendo um "classificador de detecção" capaz de identificar videoclipes gerados por Sora e planeja incluir certos metadados na saída para ajudar a identificar o conteúdo gerado por IA. Esse é o tipo de metadados que a Meta busca usar para identificar imagens geradas por IA.

Sora é um modelo de IA que usa a arquitetura Transformer que os pesquisadores do Google apresentaram em um artigo em 2017. Em seu anúncio, a OpenAI disse que Sora serve como base para modelos que entendem e simulam o mundo real.

[anúncio_2]
Link da fonte