Здесь я получаю сообщение об ошибке ValueError: X имеет 12711 объектов на выборку;ожидая, что 18564 кто-нибудь знает, как ее решить
я использую TfidVectorizer для отправки текстовых данных о поездах, но когда я прогнозирую свою модель, следующее = ошибка крыла
Вот мойкод, m / 4Q0OO.png
data[:0]
>>>['Meals can be served in rooms at 9:00 p. m.']
data = co_ve.fit_transform(data)
data = transf.fit_transform(data)
from sklearn.linear_model import SGDClassifier
clf = SGDClassifier(loss ='hinge', alpha= 1e-3,max_iter= 5, tol= None)
model = clf.fit(data, label)
sol = pd.read_csv('Text.csv')
s_data = []
for i ,j in zip(sol['question'], sol['answer_text']):
i = i + ' ' + j
s_data.append(i)
s_data = co_ve.fit_transform(s_data)
s_data = transf.fit_transform(s_data)
ta = clf.predict(s_data)
Я получаю следующие ошибки
/usr/local/lib/python3.6/dist-packages/sklearn/linear_model/base.py in decision_function(self, X)
268 if X.shape[1] != n_features:
269 raise ValueError("X has %d features per sample; expecting %d"
ValueError: X has 12711 features per sample; expecting 18564