Empresas com bolsos largos controlam inteiramente chatbots poderosos como ChatGPT.
Se você acha a existência de chatbots alimentados por IA como o ChatGPT algo perigoso, aí é uma história diferente.
É preciso muito esforço para manter a arquitetura que suporta o funcionamento de tal chatbot. Claro, o pessoal da OpenAI fez um trabalho impressionante. Mas, não temos transparência, nem voz da comunidade, e não é livremente acessível para os outros construírem sistemas semelhantes ao ChatGPT.
Assim como temos o Linux como uma alternativa ao Windows e macOS, precisamos de uma solução de código aberto para oChatGPT.
Infelizmente, não é tão simples quanto parece.
Para treinar modelos de IA para chatbots, um projeto precisa de um enorme poder de computação e conjuntos de dados para treinar o modelo. E os projetos de código aberto não têm necessariamente o tipo de financiamento para fazer isso acontecer, a menos que alguém apaixonado decida investir muito para lutar contra as grandes empresas de tecnologia.
Felizmente, uma equipe de profissionais talentosos parece ter feito progressos promissores no desenvolvimento de uma alternativa ChatGPT de código aberto.
OpenChatKit da Together
Together é uma organização que visa superar os desafios de criar um sistema de código aberto semelhante ao ChatGPT.
Obrigado ao TechCrunch por detectar um empreendimento tão interessante.
Eles recentemente revelaram seu primeiro grande projeto, OpenChatKit, uma estrutura para criar chatbots alimentados por IA. Junto com o projeto, você também pode encontrar modelos treinados que qualquer desenvolvedor pode usar para criar um chatbot alimentado por IA.
Você pode encontrá-lo no GitHub para explorar as partes técnicas sobre ele e uma demo para testar os modelos.
Com os repositórios de código aberto, qualquer um pode replicar o mesmo, ajustar sua própria experiência e integrá-la às coisas.
A Together também colaborou com outras organizações de pesquisa, incluindo LAION (responsável pelo desenvolvimento do Stable Diffusion) e Ontocord, para criar um conjunto de dados de treinamento contendo mais de 40 milhões de exemplos de perguntas e respostas.
O conjunto de dados é chamado Open Instruction Generalist Dataset.
Claro, considerando que o OpenChatKit é algo novo, ele ainda precisa de um longo caminho a percorrer, mas não é ruim em responder a perguntas típicas e interessantes.
Além disso, o OpenChatKit também fornece um bom recurso de moderação (um conjunto de dados está disponível), que os desenvolvedores podem melhorar e usar.
De um modo geral, a natureza aberta do desenvolvimento deverá ser útil num futuro próximo. Citando o que o fundador da Together (Vipul Ved Prakash) menciona através da cobertura do TechCrunch:
Nossa tese é que quanto mais a comunidade de pesquisa aberta puder auditar, inspecionar e melhorar as tecnologias de IA generativa, mais capacitados estaremos como sociedade para encontrar soluções para esses riscos. Acreditamos que um mundo em que o poder dos grandes modelos de IA generativa é mantido apenas dentro de um punhado de grandes empresas de tecnologia, incapazes de auditar, inspecionar ou entender, acarreta um risco maior.
O impacto dos chatbots e dos casos de uso ainda é controverso e difícil de moderar.
No entanto, com uma abordagem de desenvolvimento aberto para esse sistema, podemos trazer mais transparência, alcance da comunidade e personalização para ajustá-lo de uma maneira segura para todos e valiosa ao mesmo tempo.
O que você acha do OpenChatKit da Together? Compartilhe sua opinião nos comentários abaixo.