Novo modelo de geração de vídeo com IA de código aberto antes do GTA 6 • é Livre e Aberto!

2024 está quase no fim, e os avanços nos lançamentos de IA generativa de código aberto continuam a surpreender. Este campo dinâmico reflete tanto o progresso tecnológico quanto o crescente interesse do público.

De modelos de linguagem avançados a geradores de imagens e vídeos, organizações ao redor do mundo têm se empenhado em redefinir os limites do possível.

Recentemente, a IBM revelou uma ferramenta de extração de documentos com inteligência artificial chamada Docling. Pouco depois, um grupo de pesquisadores em Pequim apresentou o OmniGen, um modelo de código aberto que permite edição de imagens com prompts. Agora, a Lightricks se junta ao movimento com o lançamento do LTX Video (LTXV), expandindo o potencial da IA de código aberto para criação de vídeos.

LTXV: Um modelo promissor para vídeos

Crédito: Lightricks/VentureBeat

Desenvolvido pela Lightricks, empresa israelense de tecnologia, o LTXV é um modelo de IA de código aberto baseado no DiT (Diffusion Transformer). Este modelo é capaz de gerar vídeos de alta qualidade rapidamente, dependendo do hardware disponível.

Distribuído sob a Apache License 2.0, o LTXV foi treinado com grandes conjuntos de dados de vídeos e apresenta diversas vantagens:

Suporte para produção de vídeos longos.
Otimização para GPUs e TPUs.
Coerência entre quadros, minimizando problemas como cintilação.

O vídeo demonstrado, gerado em apenas quatro segundos usando GPUs NVIDIA H100, ilustra o poder do LTXV. Nele, uma empresária no distrito financeiro de uma cidade aparece em uma cena de high fashion, acompanhada de um áudio suave. Os desenvolvedores garantem que o modelo também funciona bem em hardwares de consumidores, permitindo geração de vídeos eficiente e acessível.

Como explorar o LTXV?

Para mais informações, visite o site oficial do LTXV, onde detalhes adicionais sobre o modelo estão disponíveis. Interessado em testá-lo? Confira a documentação ou a página no Hugging Face.

Os desenvolvedores também disponibilizaram o código no GitHub. Para experimentações práticas, explore o Hugging Face Playground ou o fal.ai.

Até o momento, a documentação técnica do LTXV ainda não foi publicada, mas vale acompanhar os links fornecidos para atualizações futuras.

Fonte: VentureBeat