как я могу сгруппировать значения из массива с нечеткой логикой, соответствующей 80%
combined_list = ['magic', 'simple power', 'matrix', 'simple aa', 'madness', 'magics', 'mgcsa', 'simple pws', 'seek', 'dour', 'softy']
выход:
['magic, magics'], ['simple pws', 'simple aa'], ['simple power'], [matrix]
вот что я достиг, но сильно отличается от моегоЦель.Кроме того, он поддерживает только несколько значений, и я планирую запустить его с 50 000 записей
from difflib import SequenceMatcher as sm
combined_list = ['magic', 'simple power', 'matrix', 'madness', 'magics', 'mgcsa', 'simple pws', 'seek', 'sour', 'soft']
result = list()
result_group = list()
for x in combined_list:
for name in combined_list:
if(sm(None, x, name).ratio() >= 0.80):
result_group.append(name)
else:
pass
result.append(result_group)
print(result)
del result_group[:]
print(result)
результат печати вне цикла пуст, но результат внутри цикла содержит значения, которые мне нужны.хотя вывод отличается от того, что мне нужно
['magic', 'magics']]
[['simple power', 'simple pws'], ['simple power', 'simple pws']]
[['matrix'], ['matrix'], ['matrix']]
[['madness'], ['madness'], ['madness'], ['madness']]
[['magic', 'magics'], ['magic', 'magics'], ['magic', 'magics'], ['magic', 'magics'], ['magic', 'magics']]
[['mgcsa'], ['mgcsa'], ['mgcsa'], ['mgcsa'], ['mgcsa'], ['mgcsa']]
[['simple power', 'simple pws'], ['simple power', 'simple pws'], ['simple power', 'simple pws'], ['simple power', 'simple pws'], ['simple power', 'simple pws'], ['simple power', 'simple pws'], ['simple power', 'simple pws']]
[['seek'], ['seek'], ['seek'], ['seek'], ['seek'], ['seek'], ['seek'], ['seek']]
[['sour'], ['sour'], ['sour'], ['sour'], ['sour'], ['sour'], ['sour'], ['sour'], ['sour']]
[['soft'], ['soft'], ['soft'], ['soft'], ['soft'], ['soft'], ['soft'], ['soft'], ['soft'], ['soft']]
[['simple aa'], ['simple aa'], ['simple aa'], ['simple aa'], ['simple aa'], ['simple aa'], ['simple aa'], ['simple aa'], ['simple aa'], ['simple aa'], ['simple aa']]
[[], [], [], [], [], [], [], [], [], [], []]