Mamutes na neve, uma mulher caminhando por Tóquio: estes são os primeiros vídeos criados com a nova ferramenta OpenAI Sora.
O modelo de IA que transforma avisos escritos em imagens em movimento ainda não está disponível para o público em geral. Qualquer pessoa que não seja uma das cobaias selecionadas pode ter uma visão geral das ferramentas da competição.
Alternativa Sora para pesquisa: Difusão de Vídeo Estável
Os criadores da imagem AI Stable Diffusion apresentaram sua ferramenta Stable Video Diffusion no final de 2023. O mais interessante é que a Stability AI permanece fiel a si mesma e tornou público o código da ferramenta de vídeo, que está disponível em duas versões.
Recomendações editoriais
Ao contrário do Sora, no entanto, os dois modelos de difusão de vídeo estável são projetados principalmente para pesquisadores e atualmente ainda são caracterizados por uma série de limitações.
As taxas de quadros dos vídeos, por exemplo, são de apenas 14 ou 25 quadros por segundo, e a resolução é de 576 x 1.024 pixels. E: Os vídeos têm menos de quatro segundos; às vezes, os clipes são criados sem qualquer movimento.
O Sora, por outro lado, tem como objetivo produzir clipes fotorrealistas que podem ter até um minuto de duração.
Vídeos de IA da Meta: Make-a-Video
O Meta de Mark Zuckerberg introduziu uma ferramenta de vídeo de IA já em 2022. Make-a-Video cria clipes de até cinco segundos de duração.
No entanto, eles ainda estão sem som e pareciam relativamente artificiais e distorcidos quando apresentados em 2022. 16 imagens com resolução máxima de 64 x 64 pixels são produzidas por segundo. No
Sora faz OpenAI Ainda não há informações sobre os dados técnicos exatos.
Apresentação em vídeo do kit AI: Quinvio AI
A startup Quinvio AI oferece uma ferramenta de IA para pequenos vídeos explicativos.
Trata-se menos de cenas cinematograficamente impressionantes, como os mamutes na neve que a OpenAI gerou com Sora. Em vez disso, os palestrantes gerados por IA definem scripts de apresentação criados anteriormente com música em um fundo simples.
A versão de avaliação gratuita do Quinvio permite criar um clipe de até 30 segundos de duração.
Texto para vídeo com Gen-2 da Runway
No início de 2023, a startup de IA Runway lançou sua ferramenta de vídeo AI Gen-2. Se quiser experimentar o software, você deve fazer login no aplicativo iOS ou navegador da Runway.
Os vídeos de demonstração que a Runway mostrou ao apresentar o Gen-2 não eram fotorrealistas e às vezes apresentavam pequenos erros – mas com um pouco de tempo o software poderia se tornar uma alternativa interessante ao Sora.
Vídeos gerados por IA do Google: Lumiere e Videopoet
O Google está atualmente trabalhando em duas ferramentas de IA de vídeo. O Videopoet não apenas cria vídeos a partir de prompts de texto, mas também pode adicionar música a clipes existentes ou converter imagens em vídeos.
É semelhante ao Lumiere, mas também possui recursos para edição de vídeo. Até o momento, há principalmente material de demonstração das ferramentas, ambas apresentadas em janeiro de 2024 – informações mais detalhadas ou mesmo a oportunidade de experimentá-las provavelmente surgirão em um futuro próximo.