Python TweetTokenizer TypeError: ожидаемая строка или байтовоподобный объект - PullRequest
0 голосов
/ 16 апреля 2020

Я пытаюсь TweetTokenize столбец твит из моего набора данных. Вот мой код:

import pandas as pd
from nltk.tokenize import TweetTokenizer

dataset = pd.read_csv(r'C:\Users\B\Desktop\Resources\train.csv')
tweets = pd.DataFrame(dataset, columns=['tweet'])

tknzr = TweetTokenizer(strip_handles=True, reduce_len=True)
tokenized_tweets = tknzr.tokenize(tweets)
print(tokenized_tweets )

Я получаю эту ошибку

    return ENT_RE.sub(_convert_entity, _str_to_unicode(text, encoding))

TypeError: expected string or bytes-like object
...