Я прочитал эту статью ранее и заметил, что функция pandas apply, iterrows и l oop - это очень медленный и эффективный способ работы с pandas фреймами данных.
Я выполняю анализ настроений на некоторых текстовых данных, но использование применения приводит к высокому использованию памяти и низкой скорости, подобной показанной в этом ответе.
%%time
data.merge(data.essay.apply(lambda s: pd.Series({'neg':sid.polarity_scores(s)['neg'],
'neu':sid.polarity_scores(s)['neu'],
'pos':sid.polarity_scores(s)['pos'],
'compound':sid.polarity_scores(s)['compound']})),
left_index=True, right_index=True)
Как я могу реализовать это, используя либо встроенная функция numpy или pandas? Изменить: - столбец содержит текстовые данные эссе