Я создал конвейер scikit-learn и загрузил модельную версию в ml-engine, отправив учебное задание.Когда я запрашиваю локальный прогноз из модели, я получаю другую вероятность, чем когда я запрашиваю онлайн-прогноз, но я использую тот же входной файл.В моем конвейере я создал ColumnTransformer, который содержит OneHotEncoder () для категориальных данных и StandardScaler () для числовых данных.Что-то происходит во время учебной работы, которая меняет конвейер, или это может быть что-то не так с моей локальной средой при вызове gcloud ml-engine predict
?
transformer = ColumnTransformer(transformers=[('numerical', StandardScaler(
), [0, 1]), ("categorical", OneHotEncoder(categories=[array1, array2]), [2, 3])])
transformer.fit(X)
logClf = LogisticRegression(random_state=42, solver='liblinear')
logClf.predict = logClf.predict_proba
pipeline = Pipeline([
('transformer', transformer),
('classifier', logClf)])
pipeline.fit(X_train, y_train)
В версии модели используется scikit-learn 0.20.0и Python версии 3.5.