Распознавание образов в столбцах панд - PullRequest
0 голосов
/ 22 ноября 2018

Я не знаю, является ли stackoverflow подходящим местом для публикации, если нет, скажите, пожалуйста, альтернативу.

У меня есть набор данных, в котором я хочу классифицировать данные в столбце "opmerking" (opmerking = comment).Я создал фиктивный набор данных, чтобы объяснить, что я имею в виду.

enter image description here каждое число представляет байт, где каждый бит означает что-то еще.Итак, у меня есть скрипт, который берет самые важные биты из этих байтов, и этот набор данных выглядит следующим образом:

enter image description here

Байты / биты должны указывать циклычасти оборудования, и мне нужно определить, где цикл не является нормальным.До сих пор я могу обнаружить строки, в которых происходит ненормальное поведение, но мне хотелось бы, чтобы полный цикл.

это код, который я использую для поиска отклонений в битовых данных:

dfphotocells = dfsamen[(dfsamen.closeout == 0) & (dfsamen.openout == 0) & (dfsamen.limitswitchopen == 0) & (dfsamen.limitswitchclose == 0) & (dfsamen.prelimit == 0) & (dfsamen.photocells == 1) & (dfsamen.lampgroen == 1) & (dfsamen.lamprood == 1) & (dfsamen.halfopen == 0 ) & (dfsamen["DateTime"]>='2018-06-1 00:00:00') & (dfsamen["DateTime"]<='2018-10-10 00:00:00')]
dfphotocells['opmerking'] = 'photocells'

это, очевидно,дает только строки, где фотоэлементы = 1.

Я думал об использовании наивного байесовского классификатора, но я не знаю, насколько точным это будет.

Итак, мой полный вопрос: должен ли я смотреть на свои циклы побитово или побитно и какой метод я должен использовать для обнаружения полного цикла?(я не ищу кого-то, кто мог бы написать это для меня, просто толчок в правильном направлении)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...