Как определить или сказать, являются ли данные полным шумом (или случайным)? - PullRequest
0 голосов
/ 24 сентября 2019

У меня есть данные с более чем 200 000 строк, и в течение двух недель я пытался определить любой паттерн или сигнал в данных.Это проблема классификации, и я уже пробовал деревья логистической регрессии и принятия решений, но результаты кажутся совершенно случайными.AUC / ROC - это линия с углом наклона 45 градусов, то есть 0,5, что указывает на полную случайность.Теперь я чувствую, что прежде чем пытаться продолжить работу с любыми другими моделями, я хочу определить, есть ли какой-либо сигнал или шаблон в данных или это полный шум.Есть ли способ определить это?

Кроме того, если данные представляют собой полный шум, я хотел бы дать некоторые рекомендации относительно того, как представлять результаты.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...