найти биграммы в pandas - PullRequest
       4

найти биграммы в pandas

0 голосов
/ 11 января 2020

У меня есть DataFrame с 4 столбцами: «Заголовок», «Body_ID», «Стойка», «articleBody», с «Заголовком» и «articleBody», содержащими очищенные и размеченные слова. Я хочу найти биграммы, используя nltk, и у меня так:

bigram_measures = nltk.collocations.BigramAssocMeasures()
articleBody_biGram_finder = df_2['articleBody'].apply(lambda x: BigramCollocationFinder.from_words(x))

У меня проблемы с последним шагом применения articleBody_biGram_finder с bigram_measures. Я пробовал несколько итераций лямбда с пониманием списка, но не получаю.

мои последние попытки:

df_2['articleBody_scored'] = score_ngrams(bigram_measures.raw_freq) for item in articleBody_biGram_finder

df_2['articleBody_scored'] = articleBody_biGram_finder.apply(lambda x: BigramCollocationFinder.score_ngrams(bigram_measures.raw_freq))

1 Ответ

0 голосов
/ 12 января 2020

df_2['bigram_scored'] = df_2['bigram_finder'].apply(lambda x: x.score_ngrams(bigram_measures.raw_freq))

...