Я хочу обновить свой код, так как алгоритм занимает 17 часов для вычисления. Я попробовал несколько методов, но не сработало. Не могли бы вы предложить мне любую альтернативу кода, чтобы сэкономить время?
%% time
# test algorithm1 - fuzzy
matched_pair = []
for x in dataset1['full_name_eng']:
for y in dataset2['name']:
if (fuzz.token_sort_ratio(x,y) > 85):
matched_pair.append((x,y))
print((x,y))
Я сравниваю имена из 2 столбцов набора данных и нахожу подходящую пару.