У меня есть DataFrame с 4 столбцами: «Заголовок», «Body_ID», «Стойка», «articleBody», с «Заголовком» и «articleBody», содержащими очищенные и размеченные слова. Я хочу найти биграммы, используя nltk, и у меня так:
bigram_measures = nltk.collocations.BigramAssocMeasures()
articleBody_biGram_finder = df_2['articleBody'].apply(lambda x: BigramCollocationFinder.from_words(x))
У меня проблемы с последним шагом применения articleBody_biGram_finder
с bigram_measures
. Я пробовал несколько итераций лямбда с пониманием списка, но не получаю.
мои последние попытки:
df_2['articleBody_scored'] = score_ngrams(bigram_measures.raw_freq) for item in articleBody_biGram_finder
df_2['articleBody_scored'] = articleBody_biGram_finder.apply(lambda x: BigramCollocationFinder.score_ngrams(bigram_measures.raw_freq))