Я работаю над проектом в Weka. Моя задача состоит в том, чтобы построить модель интеллектуального анализа данных для данного обучающего набора и использовать эту модель для прогнозирования классов данного тестового набора (там также приведены классы). Кроме того, сравнение поддерживается с помощью матрицы затрат.
Я закончил свою модель, лежащую в основе данных обучения. Но сейчас я не совсем уверен, как использовать его для моих тестовых данных. Вот мои возможные решения на данный момент:
1) Возьмите тренировочные данные и модель на их основе и используйте «поставляемый набор тестов». 2) Возьмите тестовые данные, загрузите модель из обучающих данных и обычно классифицируйте данные.
В обоих случаях моя денежная ценность отрицательна, а это не то, чего я хочу (задача состоит в максимизации прибыли). Когда я взял 2) и использовал перекрестную проверку, денежная ценность была положительной, но я не совсем уверен, правильно ли добавлять перекрестную проверку в набор тестов при классификации его с уже построенной моделью.