Использование SMOTE на тренировочных данных - PullRequest
0 голосов
/ 26 мая 2019

У меня несбалансированный набор данных, и я хочу использовать SMOTE. Я работаю с Azure ML. Я прочитал много примеров на странице Microsoft Doku. Мне интересно, почему SMOTE устанавливается перед функцией SPLIT DATA, а не после SPLIT DATA в наборе данных 70% для обучения. Все примеры, которые я видел, перед функцией SPLIT DATA. Это правильное использование SMOTE?

Вот пример из Microsoft: https://imaginemedia.blob.core.windows.net/content/Lab%20PDF%20-%20Churn%20Prevention%20and%20Intervention-db9732e3e8c6.pdf enter image description here

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...