FuzzyWuzzy.ratio с использованием python-Левенштейна возвращает не балл Левенштейна, а соотношение Левенштейна, которое составляет (a + b - LevenshteinScore) / (a + b), где a и bявляются длинами двух сравниваемых строк.
Если у вас не установлен python-Levenshtein, то fuzzywuzzy вообще не использует Levenshtein.В связи с этим домашняя страница Fuzzywuzzy вводит в заблуждение, хотя и рекомендует установить python-Levenshtein.
python-Levenshtein имеет некоторые проблемы с установкой;Я использовал второй ответ на этот вопрос stackoverflow , чтобы решить его.
Если у вас не установлен Python-Levenshtein, вместо этого FuzzyWuzzy использует difflib , что тоже самоедля многих входных значений, но не для всех.Разработчики рекомендуют использовать python-Levenshtein.См. эту проблему в git от fuzzywuzzy, который включает в себя пример случая, когда результаты с пакетом отличаются по сравнению с пакетом без него.Это, вероятно, не должно происходить, или, по крайней мере, документация должна прояснить это, но разработчики FuzzyWuzzy кажутся довольными, по крайней мере, функциональностью.