De acordo com a CNBC , a OpenAI acaba de lançar o Sora — um modelo de IA de última geração que funciona de forma semelhante à sua ferramenta de IA de geração de imagens anterior, o DALL-E. Os usuários simplesmente inserem a cena desejada e o Sora retornará um videoclipe de alta resolução. O Sora também pode criar videoclipes inspirados em imagens estáticas e expandir vídeos existentes ou preencher quadros ausentes.
Cães samoiedos e golden retrievers brincam em uma cidade iluminada por neon à noite em um vídeo gerado por IA
A criação de vídeos pode ser a próxima fronteira da IA criativa, depois que chatbots e geradores de imagens conquistaram espaço nos universos do consumidor e dos negócios há pouco tempo. Embora a criação de conteúdo entusiasme os entusiastas da IA, essas novas tecnologias estão levantando sérias preocupações sobre desinformação à medida que as principais eleições políticas globais se aproximam. De acordo com dados da empresa de aprendizado de máquina Clarity, o número de deepfakes gerados por IA aumentou 900% em relação ao ano anterior.
Com o Sora, a OpenAI busca competir com ferramentas de IA para geração de vídeos de empresas como Google e Meta. Ferramentas de IA semelhantes estão disponíveis em outras startups, como a Stability AI, que tem um produto chamado Stable Video Diffusion. A Amazon também lançou o Create with Alexa, um modelo especializado em gerar conteúdo animado de curta duração para crianças com base em comandos.
Atualmente, o Sora está limitado a gerar vídeos de até um minuto de duração. A OpenAI tornou a multimodalidade, um método que combina geração de texto, imagem e vídeo, um objetivo em um esforço para fornecer um conjunto mais amplo de modelos de IA.
Até o momento, o Sora só foi disponibilizado para um pequeno grupo de testadores de segurança, ou "equipes vermelhas", que testam o modelo em busca de vulnerabilidades em áreas como desinformação. A empresa não divulgou nenhuma demonstração pública além dos 10 clipes de amostra disponíveis em seu site e afirma que a documentação técnica que a acompanha será divulgada em breve.
A OpenAI também afirma estar desenvolvendo um "classificador de detecção" capaz de identificar videoclipes gerados por Sora e planeja incluir certos metadados na saída para ajudar a identificar o conteúdo gerado por IA. Esse é o tipo de metadados que a Meta busca usar para identificar imagens geradas por IA.
Sora é um modelo de IA que usa a arquitetura Transformer que os pesquisadores do Google apresentaram em um artigo em 2017. Em seu anúncio, a OpenAI disse que Sora serve como base para modelos que entendem e simulam o mundo real.
Link da fonte
Comentário (0)