Анализ настроений Textblob в списках токенизированных слов - PullRequest
0 голосов
/ 14 мая 2019

У меня есть следующий DataFrame.

Date            Cleaned tweets
2018-05-23  [media, want, pravda, exist, write, aicle, tel...
2018-05-23  [yeah, think, great, work]
2018-05-23  [exactly, uaw, individual, stock, ownership, p...
2018-05-23  [um, tweeted, obv]
2018-05-23  [thank, thought, obvious]

Я создал модуль python для Textblob Sentiment Analysis, который выглядит следующим образом:

class TextBlobSentimentAnalysis:

    def analyze_sentiment_polarity(self,word):
        sentiment_analysis = TextBlob(word)

        if sentiment_analysis.sentiment.polarity > 0:
            return 1                                             
        elif sentiment_analysis.sentiment.polarity == 0:
            return 0      
        else:                                  
            return -1                                              

    def analyze_sentiment_subjectivity(self,tweet):
        subjectivity_analysis = TextBlob(tweet)

        if subjectivity_analysis.sentiment.subjectivity >0:       
            return 1                                               
        elif subjectivity_analysis.sentiment.subjectivity ==0:    
            return 0                                               
        else:                                                      
            return -1                                              

Моя проблема в том, что я хочуНужно проанализировать Чувство каждого слова в Списке каждой ячейки, а затем вычислить их среднее значение, чтобы иметь только одно значение полярности и субъективность для каждой строки Фрейма данных.Каждый раз, когда я пытаюсь получить доступ к словам, и я делаю Чувство каждого из них, я получаю чувство всех слов каждого Списка вместе и не могу отличить их от одного Списка к другому.

Что у меня естьпопытался сделать следующее:

import statistics
for list_of_words in df['Cleaned tweets']:
    polarity = []
    for word in list_of_words:
        polarity += [TextBlob_Analyzer.analyze_sentiment_polarity(word)]
        avg_per_tweet = [statistics.mean(polarity)]

но он получает мне только одно значение и равен нулю.

Textblob_Analyzer - это то, как я вызываю класс TextblobSentimentAnalysis.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...