ElasticSearch: обработка данных между несколькими индексами - PullRequest
0 голосов
/ 04 апреля 2020

У меня есть 2 индекса. Эти 2 индекса связаны между собой.

Например, допустим, первый индекс содержит всю информацию, относящуюся к электронной книге. Информация, такая как автор, дата публикации, название и т. Д. c. будет проиндексирован здесь.

А второй индекс содержит все абзацы в книге. Информация, такая как идентификатор книги, содержание параграфа, номер страницы, информация о сложном объекте и т. Д. c. здесь будут проиндексированы.

Когда я хочу запросить абзацы из 2-го индекса на основе информации 1-го индекса, такой как название книги или опубликованные данные, как мне это сделать?

  1. Желательно ли хранить всю метаинформацию 1-го индекса внутри 2-го индекса, чтобы применять фильтры и запрашивать его документы. Таким образом, я буду бесполезно раздувать 2-й индекс с дубликатами, которые у меня уже есть в 1-м индексе.
  2. Есть ли способ, которым я могу сформировать связь между этими индексами?
  3. Можно ли вести единый индекс для моего случая? Как и хранение всей информации, связанной с абзацами, в самом 1-м индексе в виде списка объектов. В этом случае каждый документ в первом индексе будет огромным (скажем, список из 10000 проиндексированных или более абзацев) и будет ли он эффективен при выполнении операции запроса?

Или есть какой-то другой способ Я могу решить это?

Любая помощь, высоко ценится.

...