Spring Mongodb строка поиска внутри двоичных данных - PullRequest
0 голосов
/ 24 апреля 2020

Я храню документ (text, pdf, csv, do c, docx et c) в mongodb, используя пружинный отдых. Документы сохраняются в виде двоичных данных. Теперь я хочу искать документы на основе содержимого внутри него. Например, если пользователь ищет строку «офис», он должен увидеть список документов, который содержит строку «офис». Как я могу запросить у mongodb данные, содержащиеся в двоичных данных?

1 Ответ

0 голосов
/ 24 апреля 2020

Вы можете попытаться определить текстовый индекс для ваших двоичных файлов. Я не знаю, будет ли это работать, но даже если это произойдет, такой индекс будет соответствовать любым словам, которые являются частью формата файла , а не пользовательскому контенту, который обычно нежелателен.

Если бы я выполнял ваши требования, я бы использовал преобразователь из всех двоичных документов в простой текст (например, pando c), получая, таким образом, пользовательское содержимое каждого из документов, затем вставляя это содержимое в поле с текстовым индексом, затем запросите это поле.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...