Lucene поиск близости с границами? - PullRequest
3 голосов
/ 11 сентября 2011

Есть ли способ выполнить поиск близости, который ограничен не фиксированным числом токенов, а какими-то маркерами 2? Например, реализовать запросы близости, которые ограничены внутри как одно предложение или абзац? Очевидно, что анализатор должен поддерживать его, но было ли это сделано раньше и как?

1 Ответ

5 голосов
/ 11 сентября 2011

SpanPositionCheckQuery - абстрактный класс, определяющий запрос span, который проверяет, согласованный промежуток проходит проверку позиции. Конкретные реализации включают SpanPositionRangeQuery, который проверяет, находится ли совпадение в определенном диапазоне позиций, и SpanPayloadCheckQuery, который проверяет, совпадают ли полезные нагрузки совпадающих позиций с запрошенными.

Может быть, вы могли бы достичь желаемого, назначив полезную нагрузку каждому токену, указав, к какому предложению / абзацу он принадлежит (со счетчиком), а затем проверив, равны ли все полезные нагрузки сопоставленного диапазона? Я думаю, что продвижение выше класса для достижения этого должно быть простым.

...