O (ND) разностный алгоритм и его вариации, реализованные в python - PullRequest
0 голосов
/ 14 октября 2018

Я пытаюсь вычислить сходство документов на основе минимального расстояния редактирования.Поскольку я хотел бы, чтобы это было сделано с python.

Я обнаружил, что статья "Разностный алгоритм O (ND) и его вариации" является хорошей отправной точкой для начала.

А такжеобнаружил, что есть модуль perl, который вычисляет сходство документов (от 0 до 1) на основе этого метода.

https://metacpan.org/pod/String::Similarity

Есть ли какой-нибудь модуль, который я могувычислить сходство документа от 0 до 1 на python, аналогичном тому, что есть в perl?

(плюс есть аналогичный модуль python

https://github.com/google/diff-match-patch

, но я не знаю, как рассчитать индекс подобия (от 0 до 1) из этого модуля !!)

Может кто-нибудь помочь?

Заранее спасибо!

...