Как создать новый фрейм данных с оригинальными твитами - PullRequest
0 голосов
/ 17 мая 2018

Я выполняю анализ настроений в твиттере. Я сделал алгоритм, который удаляет эмодзи и некоторые специальные символы, прежде чем вычислить настроение твита. После этого твит без смайликов и специальных символов помещается в информационный фрейм с настроениями. Вот код:

x = 0
a = 0
d = {}
for vertaling in df['text']:

    bericht = re.sub('[^A-Za-z0-9]', ' ', df['text'].iloc[x])
    bericht = re.sub(' +',' ', bericht)

    translations = translator.translate([bericht], dest='en')

    for translation in translations:
        a = a + 1
        print(a)
        print(translation.origin)
        analysis = TextBlob(translation.text)
        print(analysis.sentiment)
    x = x + 1
    d[translation.origin] = analysis.sentiment
c = ['Tweets','Sentiment']   
df2 = pd.DataFrame(list(d.items()), columns=c)

Я хочу оригинальный твит в сочетании с рассчитанными настроениями. Приведенный выше код объединяет отфильтрованные твиты с настроением в этой определенной строке:

c = ['Tweets','Sentiment']<br> df2 = pd.DataFrame(list(d.items()), columns=c)

Кто-нибудь знает, как я могу объединить оригинальный твит с новым вычисленным настроением в кадре данных?

1 Ответ

0 голосов
/ 17 мая 2018

Неважно, я сам нашел решение.Решение:

x = 0
a = 0
d = {}
#df2 = pd.DataFrame(['Tweets', 'Sentiment'])
df['Tweets'] = ""
df['Sentiment'] = ""
for vertaling in df['text']:

    df['Tweets'].iloc[x] = df['text'].iloc[x]

    bericht = re.sub('[^A-Za-z0-9]', ' ', df['text'].iloc[x])
    bericht = re.sub(' +',' ', bericht)

    translations = translator.translate([bericht], dest='en')

    for translation in translations:
        a = a + 1
        print(a)
        print(translation.origin)
        analysis = TextBlob(translation.text)
        df['Sentiment'].iloc[x] = analysis.sentiment

    x = x + 1
    d[translation.origin] = analysis.sentiment

Это объединяет новые столбцы с моим существующим.

...