Я создаю веб-сайт для изучения целей и смотрю на lucene.net
в качестве полнотекстового индексатора для моего контента, но у меня есть несколько вопросов.
Допустим, у меня есть иерархия (n уровней) категорий и статей, которые относятся к одной категории (1 категория -> n статей).
Используя простой RDB, было бы очень легко найти статью в категории или любой из ее подкатегорий. Но я изо всех сил
представьте, как я построил бы такой запрос, используя lucene. Опции, которые я думаю, могут работать:
Предполагая, что я использую "заголовок, текст, категорию" для каждой статьи, можно было бы сначала получить список с идентификаторами каждой подкатегории.
из БД, а затем поиск в Lucene с этим списком.
Другой вариант - индексировать всю категорию «путь» статьи внутри поля в lucene. Что-то вроде "title", "text", "catparent1, catparent2, catparent3, category"?
Какой наилучший подход при выполнении запросов такого типа со сложными реляционными фильтрами? (не только текстовый поиск)