A IA é de código aberto? A OSI fornece uma nova definição para nos ajudar a entender!

A IA é de código aberto? A OSI fornece uma nova definição para nos ajudar a entender!

O OSI finalmente faz uma nova definição para sistemas de IA de código aberto, incentivando as organizações a fazer mais em vez de usar o termo "código aberto".

Os modelos de IA têm dominado o setor tecnológico, e muitos sistemas populares ainda são pouco transparentes devido à cautela de empresas em compartilhar seu código-fonte completo.

As empresas geralmente sugerem que essa reticência se deve ao risco de um concorrente obter vantagem usando sua tecnologia. Contudo, existe uma preocupação mais profunda.

Tanto os métodos de treinamento quanto os dados usados para desenvolver esses modelos, proprietários e de código aberto, raramente são compartilhados publicamente. Já se sabe que muitos desses dados são protegidos por direitos autorais ou propriedade intelectual, o que reflete nas saídas geradas pelos modelos.

Recentemente, a Open Source Initiative (OSI) abordou a Meta sobre essa questão, já que a empresa promove a família de modelos Llama como sendo de “código aberto” quando, no máximo, poderia ser considerada “de peso aberto”.

Para esclarecer essas questões, o OSI lançou a primeira versão da Definição de IA de Código Aberto (OSAID), uma tentativa de estabelecer um conceito claro sobre o que realmente caracteriza uma IA de código aberto.

Definição de IA de Código Aberto: o que contempla?

Imagem da página da definição de IA de código aberto

Imagem mostrando a página da definição de IA de código aberto.

A primeira versão da OSAID foi desenvolvida de forma colaborativa, contando com organizações como Open Knowledge Foundation, Wikimedia Foundation, Mozilla Foundation, Hugging Face, Amazon, Microsoft, Meta e outras (com a ausência notável da OpenAI).

Sem entrar em detalhes técnicos, aqui estão alguns dos principais pontos da definição:

  • Qualquer pessoa deve ter o direito de usar, estudar, modificar e compartilhar livremente um sistema de IA de código aberto, com ou sem modificações, para qualquer propósito.
  • Há uma condição prévia: é necessário que o sistema de IA esteja disponível em um "formato preferencial" para modificações.
  • Esse "formato preferencial" deve incluir uma descrição completa dos dados usados no treinamento, além da proveniência desses dados, uma listagem de dados publicamente acessíveis e o código-fonte usado no treinamento do sistema de IA. Até os parâmetros ou configurações do modelo precisam ser divulgados.

Em resumo, a definição cobre a “estrutura funcional completa e seus elementos estruturais discretos”. Isso inclui o modelo, os pesos, os parâmetros, e outros componentes essenciais.

Para atender aos padrões da OSAID, a arquitetura de um modelo de IA, junto aos seus elementos menores que garantem seu funcionamento, deve ser totalmente acessível e passível de modificação por qualquer um.

Além disso, o termo “sistema de IA” inclui amplamente qualquer sistema baseado em máquina que possa processar entradas e gerar saídas capazes de influenciar ambientes físicos ou virtuais, visando a objetivos explícitos ou implícitos.

Mais informações sobre o OSAID estão disponíveis na própria definição oficial.

Reflexões Finais

Uma questão importante que surge é que não há qualquer cláusula exigindo que os dados de treinamento em si sejam de código aberto. Essa omissão levanta dúvidas sobre se a definição realmente abrange os princípios do código aberto, já que uma parte crucial dos sistemas de IA permanece excluída.

Diz-se que o OSI está trabalhando para aprimorar a OSAID, com o objetivo de estabelecer diretrizes mais claras sobre como lidar com a abertura dos dados de treinamento.

Mesmo assim, essa definição representa um passo à frente em direção a um padrão.

Se quiser saber mais, confira o relatório aprofundado da OSI, que explora o processo e os aspectos de governança dessa iniciativa.

E você, o que acha da OSAID? Acredita que poderiam ter ido mais longe?

Última atualização deste artigo: 30 de october de 2024