Цикл для извлечения анализа настроений в pandas.core.series.Series - PullRequest
0 голосов
/ 08 февраля 2019

У меня есть 47 новостных статей, из которых я хочу извлечь мнение.Они в формате JSON (дата, название и текст статьи).Все, что я хочу, это получить список с настроением, используя TextBlob.Пока я делаю следующее:

import json
import pandas
from textblob import TextBlob

appended_data = []

for i in range(1,47):
    df0 = pandas.DataFrame([json.loads(l) for l in open('News_%d.json' % i)])
    appended_data.append(df0)


appended_data = pandas.concat(appended_data)

doc_set = appended_data.body
docs_TextBlob = TextBlob(doc_set)


for i in docs_TextBlob:
    print(docs_TextBlob.sentiment)

Obvioulsy, я получаю следующую ошибку: TypeError: The text argument passed to __init__(text) must be a string, not <class 'pandas.core.series.Series'> Любая идея о том, как создать список с мерой настроения?

1 Ответ

0 голосов
/ 08 февраля 2019

Для создания нового столбца в DataFrame с настроением:

appended_data['sentiment'] = appended_data.body.apply(lambda body: TextBlob(body).sentiment)
...