Информационно-поисковые форматы базы данных? - PullRequest
1 голос
/ 13 апреля 2010

Я ищу некоторую документацию о том, как системы поиска информации (например, Lucene) хранят свои индексы для быстрого поиска "релевантности". Мой Google-fu меня подводит: я нашел страницу, которая описывает формат файла Lucene, но он больше сфокусирован на том, сколько бит каждого числа, чем на том, как база данных используется для создания быстрых запросов.

Конечно, у кого-то есть полезные закладки, на которые они могут ссылаться.

Спасибо!

1 Ответ

2 голосов
/ 13 апреля 2010

Индекс Lucene является инвертированным индексом, поэтому любой поиск по этой теме должен быть релевантным, например:

...