Оранжевый: Как сделать так, чтобы один и тот же PCA применялся как к поездам, так и к тестовым наборам данных? - PullRequest
0 голосов
/ 21 февраля 2020

В Orange я могу прикрепить набор данных к PCA для уменьшения размерности.

Обычно в коде я применяю обученный PCA для проверки данных после подгонки их к данным обучения.

В Orange это выглядит так, как будто PCA можно разместить только ниже по потоку от поезда или испытательного комплекта.

Есть ли способ запустить преобразование PCA, обученное на данных обучения на данных испытаний?

1 Ответ

0 голосов
/ 22 февраля 2020

Если вы тренируете модель на данных, преобразованных PCA, просто используйте ее на данных с исходными переменными, и они будут преобразованы автоматически.

Если вы разбили данные с помощью Data Sampler, вы можете сделать следующее .

enter image description here

Я использовал Select Columns для удаления исходных переменных.

При регрессии Logisti c модель получает данные в классифицировать (тестовые данные «Остальные данные» из выборки данных, он будет проецировать их на координаты PCA.

Если вы хотите использовать Тест и Оценка, сделайте следующее:

enter image description here

В разделе «Тест и оценка» не забудьте установить флажок «Тест на данных теста». Это немного отличается, потому что «Тест и оценка» фактически видит, что данные теста имеют переменные, отличные от данных поезда и преобразует его.

Для перекрестной проверки вам необходимо следующее.

enter image description here

В Preprocess добавьте анализ главных компонентов. и Оценка, используйте перекрестную проверку (или что-то еще). В этом рабочем процессе виджет «Предварительная обработка» предоставляет список препроцессоров, которые рассчитываются на основе данных обучения (= подходят для каждой итерации перекрестной проверки), затем «Тест и оценка» применяют эту проекцию (или другую предварительную обработку) к данным тестирования, соответствуют модели ( s) и проверяет их.

...