Descrição do método

Enquanto decorrentes ajuda a ampliar o escopo da pesquisa, simplificando flexionadas palavras ao radical, sinônimos ampliar o escopo relacionando conceitos e idéias. Como dissemos acima, um dos muitos problemas que podem nos encontrar é usar palavras não exatamente adequadas na consulta de pesquisa. Por exemplo, podemos ter o nome do campo igual a "blue jacket" no documento e nome "cyan jacket" na consulta de pesquisa. Usando o filtro sinônimo token permite fácil manuseio de sinônimos durante o processo de análise. Os sinónimos são configurados usando um arquivo de configuração.

Descrição do processo

1) Primeiro, temos de definir um filtro token do tipo sinónimo e adicionar formatos de sinónimo na formatação de sinónimos. Primeira maneira de definir um filtro:

e mais uma forma de usar um caminho para synonym.txt:

"filter" : { "synonyms_filt" : {"tokenizer": "keyword", "type" : "synonym", "synonyms_path" : "analysis/synonym.txt" } } } }

sugestão: este ficheiro analysis/synonym.txt deve estar em cada nó do conjunto. O formato do ficheiro deve ser o seguinte::

acima descrito configura um filtro de sinónimos com um caminho de analysis/synonym.txt (em relação à localização da configuração).

supergigante por Qbox: o primeiro sistema de controle total do datacenter que torna mais fácil economizar até 60% em sua conta AWS.

 "analyzer": { "filter_synonyms": { "filter": , "tokenizer": "keyword" } }

pode ver que adicionámos dois sinónimos para as cores azul e dourado. Quando o utilizador procura por "cobalt dress", o elástico irá devolver o âmbito com "cobalt" sinónimos de cor "blue, Blue, blue-gold, dark blue/black/charcoal, duke blue, jade blue, scottsdale blue, blue/white/khaki, pacific blue". Por exemplo, você pode criar uma consulta e testá-la sem sinônimos e, em seguida, adicionar o nosso analisador "filter_synonyms".

3) Vamos testar o nosso filtro de senhas personalizado:

como o segundo:

"hits" : { "total" : 36165,"max_score" : 0.62592113}

informação adicional

usando o mesmo filtro do símbolo do sinónimo tanto no tempo de índice como no tempo de pesquisa é redundante. Se substituirmos o ouro no index time pelos dois termos gold-blue e Gold, no momento da busca precisamos procurar apenas um desses Termos. Alternativamente, se não usarmos sinônimos no tempo de índice precisaríamos converter uma consulta para ouro em uma consulta para ouro ou ouro-azul no tempo de busca.

Categorias: Articles

0 comentários

Deixe uma resposta

Avatar placeholder

O seu endereço de email não será publicado.