Мою проблему было бы сложно решить, я установил solr на свою виртуальную машину Debian 9 с целью сделать массивный тест на вставку данных.В частности, с помощью скрипта
bin / post
Он загрузил все файлы PDF и DOC в мою коллекцию в Solr.Мой вопрос заключается в том, что во время выполнения запроса к контенту мой результат - это весь контент, а не показывает мне, где результат.В запросе я хочу узнать, где именно слово или предложения.
Например:
"content":["This is my \nfirst test\n This is my \nfirst test\n This is my \nfirst test\n This is my \nfirst test\n This is my \nfirst test \n"], "metadata.X-Parsed-By":["org.apache.tika.parser.DefaultParser", "org.apache.tika.parser.txt.TXTParser"], "metadata.Content-Encoding":["ISO-8859-1"], "metadata.resourceName":["tika_extract.py"], "metadata.Content-Type":["text/x-python; charset=ISO-8859-1"], "id":"4ebba9d3-239c-494d-9a1f-9ec16610530b", "_version_":1630918290423414784},
запрос:
{content: "test"}
Мой текущий результат:
"content":["This is my \nfirst test\n This is my \nfirst test\n This is my \nfirst test\n This is my \nfirst test\n This is my \nfirst test \n"]
И мне нужен этот результат:
"content": ["Это мой \ n первый тест \ n Это мой \ n первый тест \ n Это мой \ n первый тест \ n Это мой \ n первый тест \ n Это мой \ n первый test \ n "]
Моя главная цель - просто знать, где находятся слова соответствия в содержании или во всем предложении, это не проблема, другие альтернативы.
Подождите, мой вопросбыть лучшим объясненным.