Хранение обработанного текста в панде - PullRequest
0 голосов
/ 27 июня 2018

Я использовал gensim для обобщения текста в Python. Я хочу, чтобы мой обобщенный вывод был сохранен в другом столбце в одном и том же кадре данных.

Я использовал этот код:

for n, row in df_data_1.iterrows():
        text=df_data_1['Event Description (SAP)']
        print(text)
        *df_data_1['Summary']=summarize(text)*
print(df_data_1['Summary'])

Ошибка появляется в строке 4 этого кода, которая гласит: TypeError: ожидаемая строка или байтовоподобный объект.

Как сохранить обработанный текст в кадре данных панд

1 Ответ

0 голосов
/ 27 июня 2018

Если это не строка или байтовый формат, что это? Вы можете проверить тип вашей функции суммирования и двигаться дальше.

test_text = df_data_1['Event Description (SAP)'].iloc[0]
print(type(summarize(test_text))

Еще одно замечание: обычно вам следует избегать циклического перемещения по фрейму данных (см. обсуждение ). Если вы хотите применить функцию ко всему столбцу, используйте df.apply () следующим образом:

df_data1[‘Summary’] = df_data1['Event Description (SAP)'].apply(lambda x: summarize(x))
...