Сравнение / сходство документов с помощью библиотеки поиска Whoosh Python - PullRequest
3 голосов
/ 26 января 2012

Как получить меру сходства документа с помощью Whoosh?

Я хочу создать функцию «Связанные», которая ранжирует другие ранее проиндексированные документы, которые имеют высокое сходство с документом.

Вводить ли я документ в виде длинной строки запроса?Должен ли я добавить документ в индекс и извлечь из него результат запроса на сходство?

Спасибо

1 Ответ

1 голос
/ 26 января 2012

Класс поиска Whoosh имеет метод, называемый 'more_like ()' .

. Он позволяет сравнивать и индексировать документ с другими проиндексированными документами и возвращает список документов, аналогичныйданный документ.

И класс whoosh.searching.Hit может дать звание и оценку.

...