ElasticSearch и Porterstem анализатор - PullRequest
2 голосов
/ 21 марта 2011

Я смотрю на использование Elasticsearch для обеспечения функций поиска нашего сайта.

Я экспериментировал с ним, но не могу включить анализатор порттерстема (чтобы поиск поединка соответствовал поединкам и поединкам).

Вот истощение моего ввода.

curl -XPUT localhost:9200/local/ -d'
index :                     
    analysis : 
        analyzer : 
            stemming : 
                type : custom 
                tokenizer : standard 
                filter : [standard, lowercase, stop, porterStem] 
'

curl -XPUT localhost:9200/local/_mapping -d'{"properties": { "title" : { "analyzer" : "stemming", "type" : "string" }}}'

curl -XPUT localhost:9200/local/article/1 -d'{"title": "Fight for your life"}'
curl -XPUT localhost:9200/local/article/2 -d'{"title": "Fighting for your life"}'
curl -XPUT localhost:9200/local/article/3 -d'{"title": "My dad fought a dog"}'
curl -XPUT localhost:9200/local/article/4 -d'{"title": "Bruno fights Tyson tomorrow"}'

Однако поиск по запросу «бой» соответствует только первой записи - той, которая содержит точный термин.

curl -XGET localhost:9200/local/_search?q=fight

Правильные настройки, похоже, установлены, но, похоже, не работают.

  "indices" : {
    "local" : {
      "aliases" : [ ],
      "settings" : {
        "index.analysis.analyzer.stemming.type" : "custom",
        "index.analysis.analyzer.stemming.tokenizer" : "standard",
        "index.analysis.analyzer.stemming.filter.1" : "lowercase",
        "index.analysis.analyzer.stemming.filter.0" : "standard",
        "index.analysis.analyzer.stemming.filter.3" : "porterStem",
        "index.analysis.analyzer.stemming.filter.2" : "stop",
        "index.number_of_shards" : "5",
        "index.number_of_replicas" : "1"
      },

Кто-нибудь включил эту функцию и смог указать мне правильное направление?

1 Ответ

4 голосов
/ 22 марта 2011

Пример конфигурации при использовании пользовательских анализаторов с использованием инструмента «снежный ком»: Почему ElasticSearch не находит мой термин

...