2024 está quase no fim, e os avanços nos lançamentos de IA generativa de código aberto continuam a surpreender. Este campo dinâmico reflete tanto o progresso tecnológico quanto o crescente interesse do público.
De modelos de linguagem avançados a geradores de imagens e vídeos, organizações ao redor do mundo têm se empenhado em redefinir os limites do possível.
Recentemente, a IBM revelou uma ferramenta de extração de documentos com inteligência artificial chamada Docling. Pouco depois, um grupo de pesquisadores em Pequim apresentou o OmniGen, um modelo de código aberto que permite edição de imagens com prompts. Agora, a Lightricks se junta ao movimento com o lançamento do LTX Video (LTXV), expandindo o potencial da IA de código aberto para criação de vídeos.
LTXV: Um modelo promissor para vídeos
Crédito: Lightricks/VentureBeat
Desenvolvido pela Lightricks, empresa israelense de tecnologia, o LTXV é um modelo de IA de código aberto baseado no DiT (Diffusion Transformer). Este modelo é capaz de gerar vídeos de alta qualidade rapidamente, dependendo do hardware disponível.
Distribuído sob a Apache License 2.0, o LTXV foi treinado com grandes conjuntos de dados de vídeos e apresenta diversas vantagens:
- Suporte para produção de vídeos longos.
- Otimização para GPUs e TPUs.
- Coerência entre quadros, minimizando problemas como cintilação.
O vídeo demonstrado, gerado em apenas quatro segundos usando GPUs NVIDIA H100, ilustra o poder do LTXV. Nele, uma empresária no distrito financeiro de uma cidade aparece em uma cena de high fashion, acompanhada de um áudio suave. Os desenvolvedores garantem que o modelo também funciona bem em hardwares de consumidores, permitindo geração de vídeos eficiente e acessível.
Como explorar o LTXV?
Para mais informações, visite o site oficial do LTXV, onde detalhes adicionais sobre o modelo estão disponíveis. Interessado em testá-lo? Confira a documentação ou a página no Hugging Face.
Os desenvolvedores também disponibilizaram o código no GitHub. Para experimentações práticas, explore o Hugging Face Playground ou o fal.ai.
Até o momento, a documentação técnica do LTXV ainda não foi publicada, mas vale acompanhar os links fornecidos para atualizações futuras.
Fonte: VentureBeat