Я пытаюсь вычислить сходство документов на основе минимального расстояния редактирования.Поскольку я хотел бы, чтобы это было сделано с python.
Я обнаружил, что статья "Разностный алгоритм O (ND) и его вариации" является хорошей отправной точкой для начала.
А такжеобнаружил, что есть модуль perl, который вычисляет сходство документов (от 0 до 1) на основе этого метода.
https://metacpan.org/pod/String::Similarity
Есть ли какой-нибудь модуль, который я могувычислить сходство документа от 0 до 1 на python, аналогичном тому, что есть в perl?
(плюс есть аналогичный модуль python
https://github.com/google/diff-match-patch
, но я не знаю, как рассчитать индекс подобия (от 0 до 1) из этого модуля !!)
Может кто-нибудь помочь?
Заранее спасибо!