Я не уверен, как работает ML.NET CategoryorOneHotVectorizer, из их примера кода,
var pipeline = new LearningPipeline
{
// ... extra code ...
new CategoricalOneHotVectorizer("VendorId", "RateCode", "PaymentType"),
// ... extra code ...
new FastTreeRegressor()
};
смотрит на меня, как только мы вызываем model = pipeline.Train () для обучения модели, это делаеткодирование только по категориальным входным данным.Так что, если мои тестовые данные имеют некоторые значения, которых нет во входных данных, это испортит результат предсказания?
Обычно на Python я обучил бы OneHotEncoder как для обучения, так и для тестирования данных, прежде чем использовать его для кодирования категориальных переменных.,Не уверен, как это сделать с ML.NET