У меня есть предопределенный список слов;Например:
wordlist = [["one"],["two"],["three"]]
И у меня есть большой набор файлов .txt, также импортированных в python в виде списка, например:
corpus = ["my friend has one potato",
"i have two bananas and three apples",
"my dad has three apples"]
Я хочу формулу, которая проходит через корпусстрока за строкой и сообщает мне количество слов из моего списка слов, которые содержатся в каждой строке;то есть, примерный вывод будет:
1
2
1
Мне не нужно разграничивать слова в списке слов.
Однако я хочу, чтобы это была формула, чтобы я мог легко ее применитьс другими списками слов или корпусами.
Я не нашел ответа ни на SO, ни где-либо еще.Я попробовал следующее:
wordcount_total=list()
for i in range(len(corpus)):
row=corpus[i]
wordcount_row=sum(1 for word in row.split() if word in wordlist)
wordcount_total.append(wordcount_row)
Однако это дает мне:
0
0
0
Большое спасибо всем, кто хочет помочь!