Я пытаюсь провести анализ настроений над списком заголовков из Reddit.Заголовки сохраняются в текстовом файле, который выглядит следующим образом (всего 1000 заголовков):
Разрешено парковочное место
Вчерашний замок и церковь
Везде, где изображена Португалия-Украинасегодня вечером?
Я использую SIA и хочу сохранить подобные результаты в CSV-файле (заголовки столбцов: заголовок, составной элемент, метка):
Где-нибудь сегодня вечером показывать игру Португалия-Украина?, 0,0,0
#Sentiment Analysis
sia = SIA()
results = []
headlines_file = open('headlines_only.txt', encoding='utf-8')
for line in headlines_file:
pol_score = sia.polarity_scores(line)
pol_score ['headline'] = line
results.append(pol_score)
#pprint(results, width=100)
#Save data in csv
df = pd.DataFrame.from_records(results)
df.head()
df = df[['headline', 'compound']]
#Added column "Label", negative Title -1 / positive 1 / neutral 0
df['label'] = 0
df.loc[df['compound'] > 0.2, 'label'] = 1
df.loc[df['compound'] < -0.2, 'label'] = -1
df.to_csv('reddit_headlines.csv', mode='w', encoding='utf-8', index=False)
Все, что я получаю в результате - это только заголовки.Без компаунда и этикетки.Но остальная часть моего кода работает нормально, поэтому соединение и метка должны быть где-то, они просто не отображаются в файле CSV.
Спасибо за помощь!