terça-feira, 24 de julho de 2012

Pesquisa agilizada com o Glimpse

O Glimpse (GLobal IMPlicit SEarch - http://webglimpse.net/) é um indexador e pesquisador, para Unix e Linux, capaz de procurar rapidamente um termo em um conjunto grande de arquivos. Esta ferramenta suporta a maioria das opções do comando agrep, incluindo a comparação aproximada e algumas expressões regulares.

Para usar o Glimpse é preciso primeiro indexar os arquivos com o comando glimpseindex. Por exemplo, a linha de comando abaixo gera um índice, no diretório '~/glimpse', dos arquivos a partir do diretório '/evidencias':

$ glimpseindex -H ~/glimpse -o /evidencias

Em seguida, para procurar por uma palavra nos arquivos do diretório indexado, usa-se o comando exemplificado abaixo. Todas as linhas que contiverem a palavra aparecerão precedidas pelo nome do respectivo arquivo:

$ glimpse -H ~/glimpse palavra

Alternativamente, é possível fazer o Glimpse ignorar o índice e ter uma execução semelhante ao comando agrep. Para isto, basta especificar o arquivo no final da linha de comando:

$ glimpse palavra /evidencias/*

A velocidade do Glimpse depende principalmente do número e tamanho dos arquivos que contiverem a palavra pesquisada. O tamanho total dos arquivos de índice não é um fator que prejudica notadamente o desempenho.

A linha de comando do Glimpse possui diversas opções, as principais são:

-#            # é um inteiro de 1 a 8 que especifica o grau do erro
              para encontrar resultados aproximados. O padrão é zero.
-e palavra    O mesmo que um simples argumento com a palavra,
              mas útil se a palavra inicia com '-'.
-G            Exibe todo o conteúdo dos arquivos que conterem a
              palavra procurada.
-h            Não exibe o nome dos arquivos que conterem a palavra
              procurada.
-H diretório  Usa os arquivos de índice do diretório especificado.
              Quando omitido o padrão é o diretório 'home'.
-i            Pesquisa insensível a maiúsculas e minúsculas. Quando usado
              -i junto com -w a pesquisa torna-se mais rápida.
-l            Exibe somente os nomes dos arquivos que conterem a palavra
              pesquisada.
-w            Pesquisa pela palavra como uma palavra inteira, isto é,
              não retorna se for uma parte de outra palavra. Esta
              opção não funciona com expressões regulares.


Exemplos de linha de comando do Glimpse:

$ glimpseindex -H ~/glimpse -o /mnt/ntfs

$ glimpse -G -H ~/glimpse palavra

$ glimpse -Gh -H ~/glimpse palavra

$ glimpse -iw -H ~/glimpse palavra

$ glimpse -1 -H ~/glimpse palavra

$ glimpse -1 'palavra1;palavra2' Documentos/*


O Glimpse também está disponível para sites web, com a ferramenta WebGlimpse.

Nenhum comentário:

Postar um comentário