AuraFlow, um gerador de imagens AI de código aberto que planeja assumir o Stable Diffusion 3

AuraFlow, um gerador de imagens AI de código aberto que planeja assumir o Stable Diffusion 3

Finalmente, um candidato verdadeiramente de código aberto à Difusão Estável!

A capacidade da IA generativa (GenAI) de criar imagens vem evoluindo rapidamente, graças às muitas inovações no campo, inaugurando uma nova era de espontaneidade criativa.

No entanto, isso tem ocorrido às custas do trabalho árduo de muitas pessoas sendo plagiado sem o seu conhecimento, conforme destacado pela OpenAI.

Apesar dessas controvérsias, o uso e desenvolvimento dessa tecnologia não diminuíram. Um dos modelos GenAI mais comentados recentemente é o Stable Diffusion 3.

No entanto, seus termos de licenciamento não agradaram a muitos, e com razão, destacando a necessidade de um modelo mais permissivo.

Uma empresa de IA sediada nos EUA, a desafiante fal.ai, introduziu um novo concorrente: "AuraFlow".

Este software, ainda em desenvolvimento, não é recomendado para uso em produção, mas é suficiente para uso casual.

AuraFlow: Um novo candidato

Uma captura de tela que consiste em muitas imagens geradas usando o AuraFlow

Criado para atender à necessidade de um modelo de código aberto de última geração, fal colaborou com desenvolvedores e pesquisadores para lançar a versão inicial do AuraFlow 0.1, disponível sob a Licença Apache 2.0.

Quando implementado, os usuários podem realizar tarefas de geração de texto para imagem com o AuraFlow, desde que possuam o hardware necessário, pois é bastante intensivo em recursos.

Durante quatro semanas de computação intensiva, AuraFlow foi submetido a um treinamento exaustivo, com pré-treinamento de imagens em vários tamanhos, como 256×256, 512×512 e 1024×1024, seguido por ajuste fino da proporção e outros ajustes.

Isso resultou em uma pontuação GenEval de 0,63~0,67 durante o pré-treinamento, com a pontuação subindo para 0,703 após o uso de um pipeline de aprimoramento imediato.

fal forneceu uma demonstração online para os usuários verificarem o AuraFlow em ação.

Uma captura de tela da demonstração online do Auraflow

Um prompt para gerar uma imagem com um Tux feliz olhando para o horizonte resultou em uma imagem com detalhes inadequados, evidenciando que o modelo ainda está em uma fase muito inicial de desenvolvimento.

Há também planos para introduzir um modelo menos intensivo em recursos para rodar em GPUs com menor VRAM e poder de computação, previsto para lançamento em breve.

Para saber mais sobre o AuraFlow, consulte o blog de anúncio da fal.

Além disso, a cobertura original de Decrypt inclui benchmarks abrangentes comparando-o com o Stable Diffusion 3 Medium.

Obtendo o AuraFlow

Os pesos do modelo para o AuraFlow estão disponíveis em Hugging Face, onde você encontrará todos os detalhes e arquivos relevantes.

O modelo já teve mais de 30.000 downloads. Aqueles que desejam criar fluxos de trabalho com este modelo podem começar com a versão mais recente do ComfyUI.

Para participar da comunidade, é possível ingressar no servidor Discord oficial da fal.

Última atualização deste artigo: 26 de july de 2024