У меня две строки:
s1='anita.daum'
s2='anita'
Я хочу провести нечеткое сопоставление между to с использованием token_sort_ratio FuzzyWuzzy.
from fuzzywuzzy import fuzz
score=fuzz.token_sort_ratio(s1.lower(),s2.lower())
Это дает мне оценку 100, а когда я просто удаляю "." от s1, то есть s1 теперь «anitadaum», оценка достигает 71.
s1='anitadaum'
s2='anita'
score=71
не ошиблись ли 100? Я понимаю, что token_sort_ratio удаляет знаки препинания из входной строки, но разве не должно быть 71 вместо 100?
Другое дело, если я попытаюсь использовать token_set_ratio вместо token_sort_ratio, я получаю 'объект кортежа, который нельзя вызвать ошибка.
пожалуйста, помогите мне с обоими проблемами.