Некоторое время назад я внедрил поисковое решение Lucene, и оно заинтересовало меня поисковыми индексами сжатых файлов. В то время я не мог найти какой-либо хорошей информации о том, как именно вы бы пошли о создании пользовательского поискового индекса, поэтому мне интересно, сможет ли кто-нибудь указать мне правильное направление?
Меня интересует форматирование файлов, сжатие и что-то похожее на концепцию документов и полей Lucene. Это не обязательно должно быть связано с конкретным языком, но если вы можете указать мне на онлайн-ресурсы, которые имеют специфичные для языка реализации с полным описанием процесса, то это тоже нормально.