У меня есть следующий DataFrame.
Date Cleaned tweets
2018-05-23 [media, want, pravda, exist, write, aicle, tel...
2018-05-23 [yeah, think, great, work]
2018-05-23 [exactly, uaw, individual, stock, ownership, p...
2018-05-23 [um, tweeted, obv]
2018-05-23 [thank, thought, obvious]
Я создал модуль python для Textblob Sentiment Analysis, который выглядит следующим образом:
class TextBlobSentimentAnalysis:
def analyze_sentiment_polarity(self,word):
sentiment_analysis = TextBlob(word)
if sentiment_analysis.sentiment.polarity > 0:
return 1
elif sentiment_analysis.sentiment.polarity == 0:
return 0
else:
return -1
def analyze_sentiment_subjectivity(self,tweet):
subjectivity_analysis = TextBlob(tweet)
if subjectivity_analysis.sentiment.subjectivity >0:
return 1
elif subjectivity_analysis.sentiment.subjectivity ==0:
return 0
else:
return -1
Моя проблема в том, что я хочуНужно проанализировать Чувство каждого слова в Списке каждой ячейки, а затем вычислить их среднее значение, чтобы иметь только одно значение полярности и субъективность для каждой строки Фрейма данных.Каждый раз, когда я пытаюсь получить доступ к словам, и я делаю Чувство каждого из них, я получаю чувство всех слов каждого Списка вместе и не могу отличить их от одного Списка к другому.
Что у меня естьпопытался сделать следующее:
import statistics
for list_of_words in df['Cleaned tweets']:
polarity = []
for word in list_of_words:
polarity += [TextBlob_Analyzer.analyze_sentiment_polarity(word)]
avg_per_tweet = [statistics.mean(polarity)]
но он получает мне только одно значение и равен нулю.
Textblob_Analyzer - это то, как я вызываю класс TextblobSentimentAnalysis.