Efeitos de áudio de IA, incluindo transcrição de voz, chegam ao Audacity

Efeitos de áudio de IA, incluindo transcrição de voz, chegam ao Audacity

A Intel lançou plugins de IA para o Audacity, oferecendo efeitos como supressão de ruído e transcrição, funcionando offline.

A Intel introduziu uma coleção de recursos de inteligência artificial (IA) destinados ao editor de áudio de código aberto Audacity.

Denominados oficialmente como plugins OpenVINO AI da Intel para Audacity, esses recursos foram projetados para operar de forma offline e local, eliminando a necessidade de servidores em nuvem, inscrições ou assinaturas, demandando apenas um hardware razoável.

Os plugins oferecem eficientes funcionalidades de economia de tempo para a edição de áudio de conteúdos como podcasts, audiolivros e entrevistas, assim como para a criação e produção musical, fortalecendo ainda mais as já crescentes capacidades de Estação de Áudio Digital (DAW) do Audacity:

  • Supressão de ruído: Para eliminar ruídos indesejados.
  • Transcrição: Permite transcrever e/ou traduzir palavras, com saída para faixas de etiquetas.
  • Geração de música: Capaz de criar novas músicas a partir de um prompt.
  • Remix de Estilo Musical: Gera novas músicas com base em músicas já existentes.
  • Separação musical: Divide uma música em partes vocais e instrumentais.

A sigla OpenVINO representa "Inferência Visual Aberta e Otimização de Redes Neurais". É um novo conjunto de ferramentas de código aberto desenvolvido pela Intel para executar tarefas de "inferência de IA" localmente em hardware Intel.

Os efeitos de Transcrição utilizam a biblioteca Whisper.cpp, enquanto Geração de Música e Remix de Estilo Musical fazem uso do Stable Diffusion e Riffusion, respectivamente.

Embora esses novos recursos de IA ofereçam utilidade, é importante observar que, no Linux, sua instalação requer compilação manual a partir do código-fonte, tanto para os efeitos de IA do OpenVINO quanto para o próprio Audacity. Não há pacotes pré-construídos disponíveis atualmente.

Felizmente, a OpenVINO fornece um guia passo-a-passo que abrange todo o processo de compilação, sendo especificamente elaborado para o Ubuntu 22.04 LTS (embora seja possível funcionar com versões mais recentes).

Embora o guia Linux seja abrangente, a compilação pode ser desafiadora devido a uma grande quantidade de dependências, algumas com vários gigabytes de tamanho, o que pode ser um obstáculo para usuários com dados limitados.

Usuários do Windows têm uma experiência mais simplificada, pois podem baixar pacotes pré-construídos contendo todos os efeitos OpenVINO AI mencionados na página de lançamentos do OpenVINO GitHub, embora seja necessário instalar a versão mais recente do Audacity para Windows.

Para mais detalhes sobre esses efeitos de IA do OpenVINO, consulte o anúncio no blog do Audacity.

Via omgubuntu.co.uk. Você pode conferir o post original em inglês:

AI Audio Effects, Including Voice Transcription, Come to Audacity

Última atualização deste artigo: 3 de january de 2024