Я хочу посчитать, сколько раз эти нграммы появляются в столбце данных (df.content), заполненном статьями. Мой фрейм данных такой:
![enter image description here](https://i.stack.imgur.com/BYyYI.jpg)
и мой список нграмм такой:
![enter image description here](https://i.stack.imgur.com/9Aoia.jpg)
Столбец 'value' в df_ngrams показывает, сколько раз конкретный ngram появляется в df.content, но я хочу подсчитать для каждой статьи
Я уже пробовал это:
ngrams_count = ['u s', 'president trump', 'donald trump', 'united states', 'white house', 'new york', 'hillary clinton', 'fox news', 'donald trumps', 'president donald']
count = 0
articleCount = 0
for i in df.content:
articleCount += 1
for j in ngrams_count:
if j in i:
count = i.find(j)
print ("article ", articleCount, "has ", count, " instances of ngram ", j)
counts = 0