Я пытаюсь TweetTokenize столбец твит из моего набора данных. Вот мой код:
import pandas as pd
from nltk.tokenize import TweetTokenizer
dataset = pd.read_csv(r'C:\Users\B\Desktop\Resources\train.csv')
tweets = pd.DataFrame(dataset, columns=['tweet'])
tknzr = TweetTokenizer(strip_handles=True, reduce_len=True)
tokenized_tweets = tknzr.tokenize(tweets)
print(tokenized_tweets )
Я получаю эту ошибку
return ENT_RE.sub(_convert_entity, _str_to_unicode(text, encoding))
TypeError: expected string or bytes-like object