Внедрить serach в корпус документа с помощью Haystack the Whoosh - PullRequest
0 голосов
/ 03 апреля 2020

Hy,

Я хочу добавить поиск в некоторый текст (конвертировать из pdf) в мое приложение. Я решил использовать Whoo sh. На данный момент я создал индекс документов со схемой, create_in и add_document из Whoosh Индекс кажется правильным, я могу прочитать его с помощью open_dir и reader из Whooo sh. Ссылка с моими Django моделями - это имя файла в схеме, который содержит идентификатор, я не уверен, что это хороший способ связать индекс с моделями ...

Теперь я пытаюсь добавить форма внешнего интерфейса, позволяющая пользователю выполнять поиск по индексу с помощью простой формы CharFiled, подобной Google, и извлекать исходный документ PDF, и я не нахожу способ сделать это. Документы, которые я нашел, объясняют, в основном, как искать в полях моделей, а не в индексированный корпус.

Спасибо за ваше время.

...