Примерное сравнение одного огромного вложенного списка с элементами другого огромного вложенного списка - PullRequest
0 голосов
/ 24 марта 2020

У меня есть два вложенных списка, один из которых содержит 10K x 6 элементов. Другой вложенный список содержит 28K * 15 элементов.

Это псевдо-логика c Я использую вложенные циклы для приблизительного сравнения.

if nested_list_1[iter_1][0] and nested_list_1[iter_2][3] appoximate_ratio > 85:
    if nested_list_1[iter_1][2] and nested_list_1[iter_2][4] appoximate_ratio > 85:
        save_to_another_list

Я могу использовать вложенные циклы для перебора каждого элемента и выполнения приблизительного сравнения. Но это занимает много времени. Есть ли способ минимизировать время потребления?

for i in range(len(nested_list_1)): #length 10000
    data_1_part_1 = nested_list_1[i][0] 
    data_1_part_2 = nested_list_1[i][1] 

    for j in range(len(nested_list_2)): #length 28000
        data_2_part_1 = nested_list_2[j][9] 
        data_2_part_2 = nested_list_2[j][15]

        if fuzzy_ratio(data_2_part_1,data_1_part_1) > 85:

            if fuzzy_ratio(data_2_part_2,data_1_part_2) > 85:

                writing_csv_file(nested_list_1[i])
...