ребята! Я получил список (final_word_list) и хотел бы сопоставить одинаковые символы из всех подсписков в списке с именем «text_under_directory» и экспортировать результат отдельно, показанный как рисунок здесь .
from nltk.tokenize import word_tokenize
final_word_list = ['zero', 'two', 'four', 'six', 'eight', 'ten', 'twelve', 'fourteen', 'sixteen']
texts_under_directory = [['one', 'two', 'three', 'four', 'five', 'six'], ['five', 'six', 'seven', 'eight', 'nine', 'ten'], ['eight', 'nine', 'ten', 'eleven', 'twelve', 'thirteen']]
# texts_under_directory[0] = ['one', 'two', 'three', 'four', 'five', 'six']
# texts_under_directory[1] = ['five', 'six', 'seven', 'eight', 'nine', 'ten']
# texts_under_directory[2] = ['eight', 'nine', 'ten', 'eleven', 'twelve', 'thirteen']
final_result = []
i = 0
while i < len(texts_under_directory):
for b in texts_under_directory[i]:
for a in final_word_list:
if a == b:
for x in word_tokenize(b):
final_result.append(x)
print(sorted(set(final_result)))
i += 1
Вывод:
['four', 'six', 'two']
['eight', 'four', 'six', 'ten', 'two']
['eight', 'four', 'six', 'ten', 'twelve', 'two']
Мой ожидаемый результат:
['four', 'six', 'two']
['eight', 'six', 'ten']
['eight' 'ten', 'twelve']