Question

Мне нужна ваша помощь, я работаю с анализом текста, классификацией текста, и когда я хочу преобразовать свой список слов в строку символов, потому что countvec не работает со списком, я получаю ошибку

    Data['FilteredArticle']=0.0
    for i in range (0,Data.shape[0]):
        DS=nlp(Data['Titre-Article'][i])
        Data['FilteredArticle'][i]=[ w for w in DS if w.is_alpha and not w.is_stop and not w.is_punct and len(w)>3] 
    from sklearn.model_selection import train_test_split
    X_train, X_valid, y_train, y_valid = train_test_split(Data.FilteredArticle , Data.classe)
    Xtrain=" ".join(X_train)
    count_vect = CountVectorizer(analyzer='word', token_pattern=r'\w{1,}')
    count_vect.fit(X_train)

TypeError Traceback (последний вызов был последним) в ----> 1 Xtrain = "" .join (X_train)

TypeError: элемент последовательности 0: ожидаемый экземпляр str, найден список введите описание изображения здесь

Ошибка типа: элемент последовательности 0: ожидаемый экземпляр str, найден список

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Ошибка типа: элемент последовательности 0: ожидаемый экземпляр str, найден список

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы