Получаете следующую ошибку при попытке использовать vectorizer.fit_transform (corpus) для файла xslt? - PullRequest
0 голосов
/ 03 февраля 2020

Я получаю следующую ошибку при попытке использовать vectorizer.fit_transform(corpus) для файла xslt,

ValueError: np.nan is an invalid document, expected byte or unicode string.

Код

import pandas as pd
import numpy as np
from sklearn.feature_extraction.text import CountVectorizer
data=pd.read_excel('D:\project review\data sets\data.xlsx') 
idea=data.iloc[:,0:1]

corpus=[]
for index,row in idea.iterrows():
    corpus.append(row['Idea'])
vectorizer = CountVectorizer()
X = vectorizer.fit_transform(corpus) 

Есть идеи?

...