Я экспериментировал с двумя наборами данных против четырех алгоритмов для решения моей проблемы регрессии. После завершения эксперимента анализ был выполнен путем проведения теста с RMSE в качестве поля сравнения. Насколько я изучал, часто желательно получить низкое значение RMSE для лучшей подгонки. Но WEKA демонстрирует алгоритмы значительно лучше, чем базовые показатели, у которых значение RMSE высокое.
Я пытался везде искать эту проблему, а также переосмыслил контекст RMSE. Некоторые говорят, что значение RMSE зависит от типа рассматриваемой проблемы, но большинство источников фокусируется на низком RMSE, как наиболее подходящем. Я также пытался использовать только WEKA Explorer, но мне нужно выполнить парный статистический тест, для которого Explorer не способен.
Dataset A >> 1.90 | 3.62 v | 3.28 v | 1.94
Dataset B >> 1.24 | 2.43 v | 2.35 v | 1.27
, где 'v' представляет собой значительно лучшую модель
Я ожидал, что RT и MLP будут работать лучше, что показал экспериментатор. Но высокое значение RMSE воспринимается значительно лучше - это путаница, с которой я сталкиваюсь.