Este é um marco para ser lembrado da história da inteligência artificial (IA) generativa! A OpenAI anunciou nesta quinta-feira (15) o lançamento de Sora — que significa céu, em japonês —, sua nova ferramenta de criação de vídeo por meio de prompts de texto.
De acordo com a empresa, Sora “pode criar cenas realistas e imaginativas a partir de instruções de texto”. O modelo de texto para vídeo permite que os usuários criem vídeos fotorrealistas de até um minuto de duração – tudo com base nas instruções que eles escreveram.
A ferramenta é capaz de gerar cenas complexas, incluindo múltiplos personagens, tipos específicos de movimento e detalhes precisos de objetos e fundos.
A empresa também observa que o modelo pode compreender como os objetos “existem no mundo físico”, bem como “interpretar adereços com precisão e gerar personagens atraentes que expressam emoções vibrantes”.
Produzindo vídeos com o Sora
Segundo explicações da OpenAI, o modelo Sora não cria apenas cenas detalhadas com base em texto, mas também pode gerar vídeos baseado em uma imagem estática, bem como completar ou estender vídeos já prontos.
A empresa fez algumas demonstrações do funcionamento da nova ferramenta, incluindo cenas aéreas da Califórnia durante a corrida de ouro, que parece ter sido filmado dentro de um trem em Tóquio, entre outros. Todos com imagens muito realistas – ou seja, sem efeitos de desenho animado, por exemplo.
No entanto, a OpenAI reconhece que o modelo ainda pode enfrentar dificuldades em simular a física de cenas complexas com total precisão, mas os resultados são, em geral, bastante impressionantes.
O Sora já está disponível?
Atualmente, o Sora ainda está em testes para total segurança da ferramenta antes do lançamento para o público geral.
De acordo com a OpenAI:
Tomaremos várias medidas de segurança importantes antes de disponibilizar o Sora nos produtos da OpenAI. Estamos trabalhando com red teamers – especialistas em áreas como desinformação, conteúdo de ódio e preconceito – que testarão o modelo de forma adversa.
Além disso, Sora também está disponível para artistas visuais, designers e cineastas selecionados para feedback.
Toda essa preocupação inclui o fato de que a empresa terá que tomar as medidas cabíveis para conseguir identificar o conteúdo gerado por IA, para não ser confundido com realidade. Eles afirmam que estão “construindo ferramentas para ajudar a detectar conteúdo enganoso, como um classificador de detecção que pode dizer quando um vídeo foi gerado por Sora.”
A empresa não afirmou quando a IA deve chegar aos demais usuários e se será uma ferramenta exclusiva para assinantes do ChatGPT.