Я хочу сравнить сходство в некоторых текстах, чтобы обнаружить дубликаты, но если я использую difflib, он возвращает разные соотношения в зависимости от порядка, в котором я даю данные.
Какой-то случайный пример ....
Спасибо
import difflib
a='josephpFRANCES'
b='ABswazdfsadSASAASASASAS'
seq=difflib.SequenceMatcher(None,a,b)
d=seq.ratio()*100
print(d)
seq2=difflib.SequenceMatcher(None,b,a)
d2=seq2.ratio()*100
print(d2)
d = 16,216216216216218
d2 = 10,81081081081081