У меня есть отзывы клиентов, хранящиеся в Pandas столбце «Чувство». Это результат data['Sentiment'].unique()
:
array(['Negative', 'Positive', '?', 'Neutral', 'nan', 'positive',
'neutral', 'negative', 'Neg', 'ppos', 'ne'], dtype=object)
Я пытаюсь сгруппировать значения в «положительный», «отрицательный» и «нейтральный» и создал три списка сопоставления:
positive = ['Positive','positive', 'ppos']
negative = ['Negative', 'negative', 'Neg']
neutral = ['Neutral', 'neutral', 'ne']
Все остальное должно быть NAn. У меня была попытка с iterrows()
в соответствии с:
for idx, row in data.iterrows():
if row['Sentiment'].isin(positive):
row['Sentiment'] == 'positive'
...
Не работает и тоже не кажется эффективным. Я пробовал использовать Series и booleans, и это кажется многообещающим подходом, но мне действительно интересно, есть ли какой-нибудь краткий обходной путь.