OpenAI apresenta Sora, nova ferramenta IA de criação de vídeo a partir de texto

O modelo de IA Sora, da OpenAI, transforma prompts de texto em cenas complexas, com vários personagens e tipos de movimentos

Em: 16/02/2024
Por: Redação Pixeld
Tempo de leitura: 2 minutos

Este é um marco para ser lembrado da história da inteligência artificial (IA) generativa! A OpenAI anunciou nesta quinta-feira (15) o lançamento de Sora — que significa céu, em japonês —, sua nova ferramenta de criação de vídeo por meio de prompts de texto.

De acordo com a empresa, Sora “pode criar cenas realistas e imaginativas a partir de instruções de texto”. O modelo de texto para vídeo permite que os usuários criem vídeos fotorrealistas de até um minuto de duração – tudo com base nas instruções que eles escreveram.

A ferramenta é capaz de gerar cenas complexas, incluindo múltiplos personagens, tipos específicos de movimento e detalhes precisos de objetos e fundos.

A empresa também observa que o modelo pode compreender como os objetos “existem no mundo físico”, bem como “interpretar adereços com precisão e gerar personagens atraentes que expressam emoções vibrantes”.

Produzindo vídeos com o Sora

Segundo explicações da OpenAI, o modelo Sora não cria apenas cenas detalhadas com base em texto, mas também pode gerar vídeos baseado em uma imagem estática, bem como completar ou estender vídeos já prontos.

A empresa fez algumas demonstrações do funcionamento da nova ferramenta, incluindo cenas aéreas da Califórnia durante a corrida de ouro, que parece ter sido filmado dentro de um trem em Tóquio, entre outros. Todos com imagens muito realistas – ou seja, sem efeitos de desenho animado, por exemplo.

No entanto, a OpenAI reconhece que o modelo ainda pode enfrentar dificuldades em simular a física de cenas complexas com total precisão, mas os resultados são, em geral, bastante impressionantes.

Você viu isso?

O Sora já está disponível?

Atualmente, o Sora ainda está em testes para total segurança da ferramenta antes do lançamento para o público geral.

De acordo com a OpenAI:

Tomaremos várias medidas de segurança importantes antes de disponibilizar o Sora nos produtos da OpenAI. Estamos trabalhando com red teamers – especialistas em áreas como desinformação, conteúdo de ódio e preconceito – que testarão o modelo de forma adversa.

Além disso, Sora também está disponível para artistas visuais, designers e cineastas selecionados para feedback.

Toda essa preocupação inclui o fato de que a empresa terá que tomar as medidas cabíveis para conseguir identificar o conteúdo gerado por IA, para não ser confundido com realidade. Eles afirmam que estão “construindo ferramentas para ajudar a detectar conteúdo enganoso, como um classificador de detecção que pode dizer quando um vídeo foi gerado por Sora.”

A empresa não afirmou quando a IA deve chegar aos demais usuários e se será uma ferramenta exclusiva para assinantes do ChatGPT.