Construído sobre o Apache Lucene, o OpenSearch é um mecanismo distribuído de busca e análise de código aberto, voltado para cenários como monitoramento em tempo real, análise de logs e sistemas de busca em sites.
Sua arquitetura escalável o torna adequado para lidar com grandes volumes de dados em ambientes distribuídos, oferecendo recursos de busca rápidos e robustos. Isso o posiciona como uma ferramenta eficaz em aplicações modernas, incluindo fluxos de trabalho baseados em inteligência artificial e aprendizado de máquina.
Após três anos de desenvolvimento, uma nova versão principal foi lançada, trazendo melhorias abrangentes que marcam um importante avanço da plataforma.
OpenSearch 3.0: Principais novidades
Visualização interativa: confira a demonstração ao vivo do OpenSearch Dashboards, com dados de voo de amostra exibidos em uma versão alfa do OpenSearch 3.0.
Com base no Lucene 10, o OpenSearch 3.0 introduz melhorias relevantes em desempenho de indexação e recuperação de dados. Um dos destaques é a indexação esparsa, que possibilita o agrupamento inteligente de documentos semelhantes, otimizando o uso de CPU e armazenamento.
Avanços na pesquisa
Entre os aprimoramentos de busca, a versão 3.0 inclui:
- Melhorias na pesquisa híbrida, com normalização Z-score para refinamento das pontuações.
- Filtro por limiar de pontuação mínima, que contribui para resultados mais relevantes.
- Ocorrências internas detalhadas, permitindo visualizar pontuações individuais dentro dos documentos.
- Agregações otimizadas com uso de estrutura de indexação baseada em “árvore em estrela”, resultando em respostas mais rápidas para consultas complexas.
Recursos vetoriais e integração com IA
O suporte a banco de dados vetorial foi significativamente aprimorado, com ênfase nos seguintes pontos:
- Integração experimental com aceleração por GPU via NVIDIA cuVS, permitindo maior desempenho em buscas vetoriais.
- Suporte nativo ao Model Context Protocol (MCP), ampliando a integração com agentes e modelos de machine learning.
- Introdução do realce semântico de frases, que aplica realce contextualizado com base no significado do conteúdo.
Monitoramento e diagnóstico
Para análise e rastreamento de desempenho, o OpenSearch 3.0 agora oferece:
- Uma nova API de Live Queries para monitoramento em tempo real de consultas em execução.
- Um parâmetro verbose que permite detalhar o impacto de cada componente de painel no desempenho.
- Colunas dinâmicas que se adaptam aos filtros aplicados, proporcionando maior flexibilidade em painéis de visualização e dashboards.
Essas melhorias facilitam a identificação de gargalos e o ajuste fino de consultas intensivas em recursos.
Alterações de suporte
Com esta versão, o suporte ao Ubuntu 20.04 foi descontinuado, em preparação para o fim do ciclo de vida do suporte padrão da distribuição, previsto para 31 de maio de 2025.
Informações adicionais estão disponíveis no anúncio oficial no blog e nas notas de lançamento completas.
Como obter o OpenSearch 3.0
A nova versão pode ser testada com Docker Compose ou instalada diretamente por meio do site oficial de downloads.
Há suporte para os principais sistemas operacionais e ambientes, incluindo Linux, FreeBSD, Docker e Windows. A documentação oficial fornece instruções detalhadas para instalação, configuração e primeiros passos.