Я новичок в НЛП и Солр. Я пытаюсь создать приложение для ранжирования прошлых судебных документов на основе недавно предоставленного документа. Я запутался в том, как использовать Solr для индексации документов, чтобы ускорить процесс обработки.
Я создал решение на python, включающее предварительную обработку с библиотекой NLTK и лемматизацию с библиотекой Spacy. И я рассчитал сходство документов с Word2Vec Word Embedding Model.
Я застрял в середине и запутался, правильно ли я поступил. Кто-нибудь может мне помочь?
Заранее спасибо.