Question

Я пытаюсь векторизовать текстовые данные, но получаю следующее ОШИБКА

AttributeError: у объекта 'list' нет атрибута 'lower'

Мой код:

yourResult = [str(sentence).split(' ') for sentence in tag_data["Tags"]]

vectorizer = CountVectorizer()
tag_dtm = vectorizer.fit_transform(yourResult)#tag.apply(lambda x: str(x).split(" ")))

Artem Trunov · Answer 1 · 20 февраля 2019

Поскольку проблема указана, yourResult - это список списков, поскольку split(' ') возвращает список, в то время как это должен быть список строк.CountVectorizer делает разделение для вас, поэтому нет необходимости делать это заранее.Это должно работать просто отлично:

tag_dtm = vectorizer.fit_transform(tag_data["Tags"])

Если вы хотите полностью контролировать работу расщепления внутри CounVectorizer, вы можете предоставить свой собственный токенизатор:

vectorizer = CountVectorizer(tokenizer=lambda s: s.split(' '))
tag_dtm = vectorizer.fit_transform(tag_data["Tags"])

iam gettinig AttributeError: у объекта 'list' нет атрибута 'lower' при попытке разделения ("") текстовых данных

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

iam gettinig AttributeError: у объекта 'list' нет атрибута 'lower' при попытке разделения ("") текстовых данных

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов