У меня есть текстовый файл с 11965 записями, который выглядит следующим образом:
AAA
BBB
CCC
DDD
Which I transformed into:
list_1 = ['AAA', 'BBB', 'CCC', ...]
И мне нужно сравнить его с другим текстовым файлом с 2221545 записями, которые выглядят так:
AAA,.ADJ UK
AAA,.N UK
AAA,.N ES
B,.ADV UK
BB,.ADV UK
BBB,.N IT
Which I transformed into:
list_2 = ['AAA\tADJ\tUK', 'AAA\tN\tUK', 'AAA\tN\tES', 'B\tADV\UK', 'BB\tADV\tUK', ...]
Итак, я должен получить диктовку, которая выглядит следующим образом:
result_dict = {'AAA':[[UK, ADJ, N], [ES,N]], 'BBB':[[IT,N]], ...}
Из-за размера второго списка, если мы сравниваем записи один за другим, временная сложность будет O(11965*2221545)
. (Я вхожу правильно?)
И поскольку мне нужно получить всю запись, я не могу использовать set для их сравнения. Есть ли эффективный способ сделать работу?