AttributeError: объект 'list' не имеет атрибута 'lower' в частоте выражения обратная частота документа - PullRequest
0 голосов
/ 08 мая 2020

Я нашел много сообщений в переполнении стека, связанных с этой проблемой. Я пробовал их, но все равно получаю ту же ошибку. Я использую python 3.7 и написал следующий код для моего набора данных urdu

Tfidf_vect = TfidfVectorizer()

x=Tfidf_vect.fit(df['final'])

Но получил сообщение об ошибке AttributeError: 'list' object has no attribute 'lower' Затем я нашел это сообщение о переполнении стека

<a href="https://stackoverflow.com/questions/51497681/attributeerror-list-object-has-no-attribute-lower-clustering">AttributeError: &#39;list&#39; object has no attribute &#39;lower&#39; : clustering</a>
. Предполагается, что TfidfVectorizer требует только список предложений. Поэтому я следую шагам, упомянутым в решении, изменяю код и использую следующий код
vectors = TfidfVectorizer()
dataset_list=df['final'].values.ravel().tolist()
X = vectors.fit_transform(dataset_list)

Доступен образец набора данных здесь Все еще та же ошибка сообщение.Можете ли вы предложить мне шаги для исправления c?

1 Ответ

1 голос
/ 08 мая 2020

Метод fit_transform принимает итерацию, которая выдает в качестве аргумента объекты str, unicode или file. Во входных данных могут быть пропущенные элементы. Убедитесь, что все товары на ул. Проверьте фрагмент ниже.

False in map((lambda x: type(x) == str), df['final'])
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...