DataFrame исчисление для анализа настроений Python - PullRequest
0 голосов
/ 22 сентября 2018

У меня следующая проблема с анализом настроений твитов, использующим список слов, имеющих слова и значения (положительные или отрицательные).Я попробовал следующий код для создания DataFrames, и он работает.Но у вас есть представление о исчислении?

Что мне нужно сделать, это определить, содержит ли твит слово из списка слов.Если он содержит несколько слов из списка слов, то суммируйте значения, назначенные каждому слову, и выводите результат (твит | сумма).Любая идея ??

import numpy as np
import pandas as pd
import json

sentimientos = open('Desktop/Ejercicio1/Sentimientos.txt')
dfis = list(map(lambda x: x.replace('\n', '').split('\t'), sentimientos))
dfis1 = DataFrame(dfis)
dfis1

for line in open('Desktop/Ejercicio1/salida_tweets.json', 'r'):
    try:
       tweet=json.loads(line)
       tweets.append(tweet)
    except:
       continue
tweet = tweets[0]

ids= [tweet['id_str'] for tweet in tweets if 'id_str' in tweet]
text= [tweet['text'] for tweet in tweets if 'text' in tweet]

    df=pd.DataFrame({'Ids':pd.Index(ids), 'Ids':pd.Index(ids)})
    df

Пример списка слов:

отказаться -2

отказаться -2

отказаться -2

похитили -2

Пример текста твита: @Brenamae_ I, КИТАЙ, СКАЖИ СВОЙ ФИН и СКАЖИ ВАМ ...

...