У меня большой набор текстовых документов, которые я буду индексировать с помощью Solr, в формате, в котором каждая строка текста имеет связанные метаданные. Например:
#metadata1
A line of text.
#metadata2
Another long, broken line of
#metadata3
text that should be searchable.
Я бы хотел проиндексировать это так, чтобы содержимое можно было искать, включая совпадения фраз, охватывающие несколько строк, но не метаданные. Однако я не могу отказаться от метаданных: я хотел бы, чтобы у любых совпадений были связанные метаданные.
например. Запрос для «строки текста» вернул бы 2 совпадения, одно из которых является первой строкой (и связанными с ней метаданными «metadata1»), а другое - второй и третьей строками (со связанными «metadata1» и «metadata2» соответственно).
Кто-нибудь может описать, как это можно сделать, или сослаться на учебник, который поможет мне начать?