Modelo de IA da Meta que ajuda a superar barreira linguística agora é de código aberto

Modelo de IA da Meta que ajuda a superar barreira linguística agora é de código aberto

No Language Left Behind by Meta é um ambicioso projeto de código aberto que visa traduzir idiomas com o mais alto nível de precisão.

Meta (anteriormente conhecido como Facebook) fez uma grande contribuição para o mundo de código aberto. Se você não sabia, a Meta trabalha em várias pesquisas e projetos inovadores como React (uma biblioteca JavaScript), além de se concentrar no Metaverso e em suas plataformas de mídia social.

Pesquisadores da Meta decidiram abrir um desses projetos, um modelo de IA chamado "Sem idioma deixado para trás".

Tentativa da Meta de não deixar nenhum idioma para trás

Fonte: Meta

Enquanto cerca de 7.000 idiomas são falados no mundo hoje, a maioria do conteúdo online está disponível em um punhado de idiomas populares como o inglês. Isso deixa muitas pessoas que não conhecem tais idiomas em desvantagem.

Embora existam muitas ferramentas para tradução, erros gramaticais podem dificultar a leitura e a compreensão do conteúdo. Além disso, se você está procurando traduzi-lo em um idioma que não é popular, não será uma experiência legal.

Especificamente, para línguas da África e Ásia.

Assim, a Meta está trabalhando em uma ferramenta de tradução com um dos resultados de maior qualidade registrados que podem ajudar a combater essa questão global.

O "No Language Left Behind", ou simplesmente NLLB-200, é um modelo de tradução automática que pode traduzir mais de 200 idiomas usando inteligência artificial

O desempenho do NLLB em cada idioma é determinado e avaliado usando um conjunto de dados complexo chamado FLORES-200 (se você estiver curioso).

Como afirmado pela Meta, os resultados da NLLB são 40% melhores do que os métodos de "pesquisa de IA anterior". Tem até uma precisão de mais de 70% para algumas das línguas menos comuns. É uma façanha impressionante!

Para ajudar a desenvolver e melhorar a qualidade das traduções, a Meta tornou o código-fonte aberto a todos os pesquisadores interessados. Isso inclui código para NLLB-200, FLORES-200, treinamento de modelos e recriação do banco de dados de treinamento.

Você pode encontrar o código-fonte no GitHub e saber mais sobre o projeto em seu post do blog.

Recompensas pela causa Social

A Meta anunciou recompensas de até US$ 200.000 de subsídios para organizações sem fins lucrativos e pesquisadores que estão trabalhando em quaisquer áreas dos Objetivos de Desenvolvimento Sustentável da ONU e traduzindo línguas africanas.

Outros pesquisadores que atualmente trabalham em áreas acadêmicas como linguística e tradução automática também são encorajados a se candidatar.

O impacto deste projeto

Embora a Meta pretenda fazer uso principalmente do NLLB em suas plataformas digitais, particularmente o Metaverso, ele pode ser extremamente impactante em outros domínios também.

Muitos usuários poderão acessar e ler facilmente recursos online em suas línguas nativas sem muito esforço. A ideia de torná-lo um projeto de código aberto deve permitir que a comunidade ajude a fazer isso acontecer.

O que você acha deste projeto da Meta?

Última atualização deste artigo: 8 de july de 2022