Fuzz.token_sort_ratio не дает правильного вывода - PullRequest
0 голосов
/ 09 июля 2020

У меня две строки:

s1='anita.daum'
s2='anita'

Я хочу провести нечеткое сопоставление между to с использованием token_sort_ratio FuzzyWuzzy.

from fuzzywuzzy import fuzz
score=fuzz.token_sort_ratio(s1.lower(),s2.lower())

Это дает мне оценку 100, а когда я просто удаляю "." от s1, то есть s1 теперь «anitadaum», оценка достигает 71.

s1='anitadaum'
s2='anita'
score=71

не ошиблись ли 100? Я понимаю, что token_sort_ratio удаляет знаки препинания из входной строки, но разве не должно быть 71 вместо 100?

Другое дело, если я попытаюсь использовать token_set_ratio вместо token_sort_ratio, я получаю 'объект кортежа, который нельзя вызвать ошибка.

пожалуйста, помогите мне с обоими проблемами.

...