В настоящее время я работаю над проектом анализа настроений, используя nltk в python. Я не могу заставить свой скрипт передавать строки текста из моего csv для выполнения токенизации. Однако, если я передаю текст по одной записи за раз, он работает нормально. Я получаю одну постоянную ошибку: «TypeError: ожидаемая строка или байтовоподобный объект», когда я пытаюсь передать весь csv. Вот напечатанный фрейм данных и код python, который я использую. Любая помощь в решении этой проблемы была бы полезна.
abstract
0 Allergic diseases are often triggered by envir...
1 omal lymphopoietin (TSLP) has important roles ...
2 of atrial premature beats, and a TSLP was high...
3 deposition may play an important role in the ...
4 ted by TsPLP was higher than that mediated by ...
5 nal Stat5 transcription factor in that TSLP st...
data = pd.read_csv('text.csv', sep=';', encoding = 'utf-8')
x = data.loc[:, 'abstract']
print(x.head())
tokens = nltk.word_tokenize(x)
print(tokens)
Прилагается ошибка трассировки полного стека. РЕДАКТИРОВАТЬ: вывести заявление
![enter image description here](https://i.stack.imgur.com/CkN0i.png)
РЕДАКТИРОВАТЬ: Выход
![enter image description here](https://i.stack.imgur.com/qMSRO.png)