Как мне создать собственный индекс поиска, похожий на Lucene? - PullRequest
2 голосов
/ 15 сентября 2008

Некоторое время назад я внедрил поисковое решение Lucene, и оно заинтересовало меня поисковыми индексами сжатых файлов. В то время я не мог найти какой-либо хорошей информации о том, как именно вы бы пошли о создании пользовательского поискового индекса, поэтому мне интересно, сможет ли кто-нибудь указать мне правильное направление?

Меня интересует форматирование файлов, сжатие и что-то похожее на концепцию документов и полей Lucene. Это не обязательно должно быть связано с конкретным языком, но если вы можете указать мне на онлайн-ресурсы, которые имеют специфичные для языка реализации с полным описанием процесса, то это тоже нормально.

Ответы [ 2 ]

1 голос
/ 15 сентября 2008

Вы также можете попробовать поискать в исходном коде отличного Sphinx поисковик.

Это современная полнотекстовая поисковая система с открытым исходным кодом, использующая разумно оптимизированные индексы.

1 голос
/ 15 сентября 2008

Управляющие гигабайты Алистер Моффат, Тимоти С. Белл

Managing Gigabytes cover

...