Google é um nome com o qual a maioria de nós está familiarizada. Mesmo que eles sejam conhecidos por coletar nossos dados, eles apoiam uma linha impressionante de projetos de código aberto que moldaram como experimentamos a internet hoje.
Agora, com o lançamento de sua AI Cyber Defense Initiative, eles têm Magika; sua ferramenta de identificação de tipo de arquivo alimentada por IA, em uma tentativa de ajudar os outros a tirar proveito de seus recursos e construir sobre ele.
Magika: O que é?
Magika é uma ferramenta que pode ser usada para detectar os tipos de arquivos mais comumente usados, como PNG, JPG, PDF, APK e muitos outros usando o poder da inteligência artificial.
O Google afirma que pode facilmente superar as ferramentas e métodos tradicionais de identificação de arquivos, com um nível de precisão médio de mais de 99%. O caso de uso mais óbvio disso seria no campo da cibersegurança, mas, mais sobre isso mais tarde.
Magika não é algo que surgiu do nada, o Google vinha usando-o internamente com o Gmail, o Drive e a Navegação segura para encaminhar arquivos para os scanners de política de segurança e conteúdo relevantes.
Tudo isso foi possível, graças à implementação de um modelo de aprendizado profundo personalizado e altamente otimizado que foi adaptado e treinado usando Keras que pesa ~1 MB.
Os tempos de inferência também são bastante rápidos graças ao Onnx, que garante operações rápidas em questão de milissegundos; semelhante a ferramentas que não são de IA, mesmo ao usar uma CPU.
Fonte: Google
Eles também compartilharam alguns benchmarks úteis que compararam o Magika com outras ferramentas, e a pontuação média F1 resultou em um aumento de cerca de 20% no desempenho quando comparado a outras ferramentas em um benchmark de arquivos 1M com mais de 100 tipos de arquivos.
Ajudando a área da Cibersegurança
Uma ferramenta como o Magika pode ser uma coisa muito potente para ter ao seu lado, já que a digitalização de arquivos em tais velocidades era inédita. Tornar seu código disponível abriu as portas para que muitos serviços e produtos focados em segurança usem isso como um componente confiável para fornecer melhor segurança aos seus clientes.
O próprio Google já começou a trabalhar na integração do Magika no VirusTotal; o serviço online que adquiriram em 2012. Ele ajuda a analisar arquivos e URLs suspeitos.
E, com a integração Magika AI, eles planejam reforçar ainda mais sua funcionalidade existente do Code Insight.
O blog de anúncio oficial tem mais detalhes se você está pronto para isso, e ficar por aí um pouco mais para aprender a tentar Magika.
Como você pode experimentá-lo?
A maneira mais simples de experimentar o Magika é a demo hospedada no site oficial. Como você pode ver acima, ele pode facilmente distinguir tipos de arquivos para vários arquivos carregados.
A captura de tela mostra apenas o resultado do primeiro arquivo, o resto estava abaixo dele. Se você quiser executá-lo localmente, ou em um servidor, então você pode instalá-lo como um pacote Python:
pip install magika
Em seguida, execute-o usando o seguinte comando para iniciá-lo:
magika
Para exemplos de comandos, ou documentação oficial, sugerimos que você faça uma visita ao repositório do Magika no GitHub.
Outra parte interessante
Quando perguntado durante uma discussão no Hacker News - por que eles lançaram um módulo nom para Magika, um dos coautores, Elie Bursztein disse que:
Nós lançamos o pacote npm porque, de fato, criamos uma demonstração na web e pensamos que as pessoas também poderiam querer usá-lo. Sabemos que não é tão rápido quanto a versão python ou uma versão C++ – e por isso marcamos como experimental.
O lançamento inclui o pacote python e o cli que são bastante rápidos e é a principal maneira que esperávamos que as pessoas usassem – desculpe se isso não ficou claro no post.
Também parece haver planos para um .deb e pacotes semelhantes em uma das edições recém-criadas no repositório Magika. É bom ver que eles pretendem suportar o Linux de mais de uma maneira.
O que você acha desse movimento do Google?