Я получаю следующую ошибку при попытке использовать vectorizer.fit_transform(corpus)
для файла xslt,
ValueError: np.nan is an invalid document, expected byte or unicode string.
Код
import pandas as pd
import numpy as np
from sklearn.feature_extraction.text import CountVectorizer
data=pd.read_excel('D:\project review\data sets\data.xlsx')
idea=data.iloc[:,0:1]
corpus=[]
for index,row in idea.iterrows():
corpus.append(row['Idea'])
vectorizer = CountVectorizer()
X = vectorizer.fit_transform(corpus)
Есть идеи?