Применить NLTK Rake к каждой строке в Dataframe - PullRequest
0 голосов
/ 01 июля 2019

Я бы хотел применить функцию Rake (https://pypi.org/project/rake-nltk/) к каждой строке в моем фрейме данных.

Я могу применить функцию индивидуально к определенной строке, но не могу добавить ее к кадру данных.

Это то, что я имею до сих пор:

r = Rake(ranking_metric= Metric.DEGREE_TO_FREQUENCY_RATIO, language= 'english', min_length=1, max_length=4)
r.extract_keywords_from_text(test.document[177])
r.get_ranked_phrases() #prints a list of keywords
test['keywords'] = test.applymap(lambda x: r.extract_keywords_from_text(x)) #trying to apply it to each row.

Это просто работает бесконечно. Я просто хочу добавить новый столбец в мой тестовый фрейм данных под названием «ключевые слова», в котором есть список ключевых слов из r.get_ranked_phrases ().

1 Ответ

0 голосов
/ 01 июля 2019

r.extract_keywords_from_text (x) вернет вам None

import pandas as pd
from  rake_nltk import Rake  

r = Rake()    

df=pd.DataFrame(data = ['machine learning and fraud detection are a must learn',
                  'monte carlo method is great and so is hmm,pca, svm and neural net',
                  'clustering and cloud',
                  'logistical regression and data management and fraud detection'] ,columns = ['Comments'])


 def rake_implement(x,r):
     r.extract_keywords_from_text(x)
     return r.get_ranked_phrases()

df['new_col'] =df['Comments'].apply(lambda x: rake_implement(x,r))
print(df['new_col'])
#o/p
0      [must learn, machine learning, fraud detection]
1    [monte carlo method, neural net, svm, pca, hmm...
2                                  [clustering, cloud]
3    [logistical regression, fraud detection, data ...
Name: new_col, dtype: object  
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...