Question

Мне нужно индексировать различные типы документов JSON, каждый документ JSON может быть в любом формате, может иметь вложенные объекты JSON (не имеет элемента управления). Как только индексация будет завершена, появится возможность поиска. Поскольку у нас нет элемента управления для схемы или формата документа JSON, мы решили использовать опцию без схемы. Застрял в следующих вопросах:

Все значения преобразуются в список из-за конфигураций в updateProcessor 'AddSchemaFieldsUpdateProcessorFactory'.
- Пример: тип данных String сопоставлен с text_general, он установлен multiValued = true.
- Если я определю поле в управляемой схеме, тогда все в порядке.
- Ввод: {"firstname":"ASGASGKSAJHAJS"} Выход: {"firstname":["ASGASGKSAJHAJS"]}

Все вложенные документы преобразуются в плоскую структуру {"firstname":"ASGASGKSAJHAJS", "address":{"addressLine1":"4216 jshakjfhajh"}} превращается в {"firstname":"ASGASGKSAJHAJS", "address.addressLine1":"4216 jshakjfhajh"}

Я пытаюсь вслепую индексировать документы любого типа (например, в формате JSON). Когда я ищу ожидающий ответ в формате, аналогичном запросу (во время индексации) с минимальными изменениями конфигурации Solr. Пока я имею дело только с JSON, следующим требованием для индексации PDF. Для моего случая использования Solr - правильный выбор, или я должен рассмотреть другие варианты?

Я новичок в Solr, изучил документацию и статьи, не нашел ни одного простого способа преодоления вышеуказанных проблем. Любое руководство будет оценено.

Индексируйте различные типы документов, используя Solr

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Индексируйте различные типы документов, используя Solr

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы