У меня есть два списка по 100 000 кортежей в каждом.В первом списке кортежей есть две строки, во второй - пять.Каждый кортеж в первом списке имеет кортеж с общим значением в другом списке.Например,
tuple1 = [('a','1'), ('b','2'), ('c','3')]
tuple2 = [('$$$','a','222','###','HHH'), ('ASA','b','QWER','TY','GFD'), ('aS','3','dsfs','sfs','sfs')]
У меня есть функция, которая может удалять избыточные значения кортежей и сопоставлять важную информацию:
def match_comment_and_thread_data(tuple1, tuple2):
i = 0
out_thread_tuples = [(b, c, d, e) for a, b, c, d, e in tuple2]
print('Out Thread Tuples Done')
final_list = [x + y for x in tuple2 for y in tuple1 if x[0] == y[0]]
return final_list
, которая должна возвращать:
final_list = [('a','1','222','###','HHH'), ('b','2','QWER','TY','GFD'), ('c','3','dsfs','sfs','sfs')]
Однако списки безумно длинные.Есть ли способ обойти вычислительное время цикла for при сравнении и сопоставлении значений кортежей?