У меня следующая проблема с анализом настроений твитов, использующим список слов, имеющих слова и значения (положительные или отрицательные).Я попробовал следующий код для создания DataFrames, и он работает.Но у вас есть представление о исчислении?
Что мне нужно сделать, это определить, содержит ли твит слово из списка слов.Если он содержит несколько слов из списка слов, то суммируйте значения, назначенные каждому слову, и выводите результат (твит | сумма).Любая идея ??
import numpy as np
import pandas as pd
import json
sentimientos = open('Desktop/Ejercicio1/Sentimientos.txt')
dfis = list(map(lambda x: x.replace('\n', '').split('\t'), sentimientos))
dfis1 = DataFrame(dfis)
dfis1
for line in open('Desktop/Ejercicio1/salida_tweets.json', 'r'):
try:
tweet=json.loads(line)
tweets.append(tweet)
except:
continue
tweet = tweets[0]
ids= [tweet['id_str'] for tweet in tweets if 'id_str' in tweet]
text= [tweet['text'] for tweet in tweets if 'text' in tweet]
df=pd.DataFrame({'Ids':pd.Index(ids), 'Ids':pd.Index(ids)})
df
Пример списка слов:
отказаться -2
отказаться -2
отказаться -2
похитили -2
Пример текста твита: @Brenamae_ I, КИТАЙ, СКАЖИ СВОЙ ФИН и СКАЖИ ВАМ ...