Мне нужна ваша помощь, я работаю с анализом текста, классификацией текста, и когда я хочу преобразовать свой список слов в строку символов, потому что countvec не работает со списком, я получаю ошибку
Data['FilteredArticle']=0.0
for i in range (0,Data.shape[0]):
DS=nlp(Data['Titre-Article'][i])
Data['FilteredArticle'][i]=[ w for w in DS if w.is_alpha and not w.is_stop and not w.is_punct and len(w)>3]
from sklearn.model_selection import train_test_split
X_train, X_valid, y_train, y_valid = train_test_split(Data.FilteredArticle , Data.classe)
Xtrain=" ".join(X_train)
count_vect = CountVectorizer(analyzer='word', token_pattern=r'\w{1,}')
count_vect.fit(X_train)
TypeError Traceback (последний вызов был последним)
в
----> 1 Xtrain = "" .join (X_train)
TypeError: элемент последовательности 0: ожидаемый экземпляр str, найден список введите описание изображения здесь