Solr
позволяет быстро получать ответы на запросы поиска, поскольку вместо поиска по тексту выполняется поиск по индексу. Это похоже на поиск страниц в книге, связанной с ключевым словом, путем сканирования индекса в конце книги, в отличие от поиска по каждому слову на каждой странице книги.
Этот тип индекса называется inverted index
, потому что она инвертирует page-centric
структуру данных (page-> words) в keyword-centric
структуру данных (word-> pages).
Inverted index
является основным термином в области Information Retrieval
и Natural Language Processing
. Возьмите документ, запишите все уникальные слова, встречающиеся в этом документе, а также их частоту. Здесь вы готовы с вашим собственным инвертированным индексом. Solr создает аналогичный инвертированный индекс документов, размещенных в его ядре, с использованием определенной схемы. Schema
- это синяя печать, которая помогает Solr в создании индексного индекса документов, предоставляя набор предопределенных полей в файле schema.xml
.