Início > Ferramentas > Apache Solr

Apache Solr

Vou fazer uma breve apresentação sobre a experiência que tenho com o Solr.
Conheci a ferramenta a 6 meses quando comecei a trabalhar para a VTEX (suas ferramentas utilizam o Solr)

O Solr é uma ferramenta de busca corporativa desenvolvida pela Apache. A principal função da ferramenta é prover performance/desempenho nos famosos full-text search. A ferramenta tem inúmeras funcionalidades que podem ser vistas aqui.

Existe a versão para Windows e Linux. Utilizamos a versão que roda como um Windows Service. A instalação é muito simples (next, next, next,..).

Como utilizamos o Solr na nossa solução
O foco principal é deixar o mais performático possível a busca das lojas virtuais. Para isso existem 2 processos principais:

  1. Indexar as informações do Solr
    Existem dois arquivos de configuração do Solr

    solrConfig.xml:
    Contém informações de configuração do Solr (em qual diretório terá as informações indexadas, parâmetros, etc).Schema.xml: Contém a estrutura XML com os campos que você deseja indexar. É possível colocar qualquer informação nesse XML. Dai vai muito do arquiteto de sistema e arquiteto de informação analisar quais informações realmente são necessárias estar indexadas.
    Se você colocar todas as informações no Solr, não é uma boa estratégia. No nosso caso indexamos as informações de produtos e cada nova informação a ser inserida no schema é altamente discutida.
    O “approach” mais interessante é indexar as informações que mais demoram para ser processadas, como por exemplo, preço, estoque, impostos, etc.É necessário então criar um programa de fila para que seus produtos estejam sempre indexados. Também é necessário um bom entendimento de quanto em quanto tempo sua informação deve estar atualizada para o usuário. Existem projetos em que já trabalhei aonde o preço do produto precisava estar atualizado em no máximo 15 minutos. Em outros projetos, ocorriam atualizações 1 vez por dia.
  2. Buscar informações do Solr
    A busca no Solr é feita através de um post na URL de onde o Solr responde. Veja na tela abaixo que buscamos todos os produtos indexados no Solr.Podemos também buscar um produto específicoEssa busca pode ser muito complexa, filtrando por categoria, departamento, produto, preço, ou qualquer informação que esteja indexada no Solr.
    Algumas informações de como utilizar a busca via querystring e functions.

É possível ter várias instancias do Solr na mesma máquina.
A ferramenta trabalha com documentos XML, CSV, JSON.

Esse foi apenas uma explicação básica de algumas funcionalidades do Solr. Para saber mais entre no site e leia a documentação. A ferramenta é de graça e muito poderosa.

Anúncios
Categorias:Ferramentas
  1. 24/07/2012 às 7:46
  1. 04/07/2012 às 14:57

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair / Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair / Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair / Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair / Alterar )

Conectando a %s

%d blogueiros gostam disto: