Как найти категорические строки выбросов / шумов в окне больших запросов - PullRequest
1 голос
/ 18 марта 2019

Как мне определить выбросы в большом запросе и пометить строки как выбросы. Для каждой строки я хочу просмотреть 5 строк до и 5 строк после и посмотреть, изменилось ли значение.

Вот пример таблицы.

enter image description here

В этой таблице я бы хотел, чтобы у выделенных строк был некоторый логический флаг, обозначающий выбросы, потому что строки изменяются только на короткую секунду. Однако, когда он меняется с 19 на 5, это нормально (при условии, что это постоянное изменение). В основном я пытаюсь удалить глюки, когда он просто изменяется от одного идентификатора пользователя к другому для 2 строк, поэтому я хочу пометить эти строки с некоторым флагом. Я думал о том, чтобы сделать это в большом запросе, просматривая запаздывающие строки и опережающие строки в данном окне (над разделом), но я не уверен, что я на правильном пути.

Это не типичный случай "выброса", поскольку все строки должны иметь одинаковое значение, за исключением сбоев, и это скорее категориальная переменная, хотя и число.

...